比如这个,如何将//之后的链接用正则表达式提取出来?谢谢!
//i0.hdslb.com/bfs/archive/33928d95e48c9bf6f5f7267402841e4da3e053d5.jpg
请问如何使用python的正则表达式提取url链接?
答案:2 悬赏:10 手机版
解决时间 2021-03-16 04:50
- 提问者网友:美人性情
- 2021-03-15 17:27
最佳答案
- 五星知识达人网友:愁杀梦里人
- 2021-03-15 17:48
import re
m=re.search(r'//[0-9A-Za-z./]+',url)具体要考虑连接里的字符,以及其他地方的正文字符
m=re.search(r'//[0-9A-Za-z./]+',url)具体要考虑连接里的字符,以及其他地方的正文字符
全部回答
- 1楼网友:风格不统一
- 2021-03-15 19:02
import reimport urlliburl=" http://www.baidu.com"s=urllib.urlopen(url).read()ss=s.replace(" ","")urls=re.findall('',ss,re.i) for i in urls: print ielse: print '显示完成'不过这样也有一点问题,如果" " 小于号的话 就会匹配其他错误的url,大家有什么更好办法不妨告诉我.
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯