如何解析文本并查找包含字符串的超链接的所有示例?超链接将不是<a href="http://test.com">test</a>
的html格式,而只是http://test.com
其次,我想转换原始字符串,并将所有超链接示例替换为可点击的html超链接。
我在这个帖子里找到了一个例子:
Easiest way to convert a URL to a hyperlink in a C# string?
但无法在python中重现:(
如何解析文本并查找包含字符串的超链接的所有示例?超链接将不是<a href="http://test.com">test</a>
的html格式,而只是http://test.com
其次,我想转换原始字符串,并将所有超链接示例替换为可点击的html超链接。
我在这个帖子里找到了一个例子:
Easiest way to convert a URL to a hyperlink in a C# string?
但无法在python中重现:(
5条答案
按热度按时间gev0vcfq1#
下面是将URL转换为C#字符串中的超链接的最简单方法?的Python移植:
输出:
cnjp1d6j2#
Here是2002年推出的一个更为复杂的正则表达式。
@yoniLavi将此缩小为:
mwkjh3gx3#
Django也有一个解决方案,它不只是使用regex.它是django.utils.html.urlize().我发现这是非常有帮助的,特别是如果你碰巧使用django.
还可以提取代码以在自己的项目中使用。
qv7cva1a4#
Jinja2( flask 使用这个)有一个过滤器
urlize
,它做同样的事情。文件
gcmastyq5#
我建议也看看urlextract
您可以运行以下命令来安装它:第一个月
urlextract
的主要优点是不用指定schema(http,ftp等)就可以找到URL,它还有很多配置选项可以根据你的需要调整提取器,所有的东西都可以在documentation中找到。