永发信息网

如何用正则抓取天猫商品的促销价?

答案:4  悬赏:20  手机版
解决时间 2021-02-26 12:29
  • 提问者网友:咪咪
  • 2021-02-26 01:12
如何用正则抓取天猫商品的促销价?
最佳答案
  • 五星知识达人网友:行雁书
  • 2021-02-26 01:35
1、天猫没有将最终的促销价格的数字写在网页源代码里;
  2、这种源码中看不到的数据,原理上是叫做Ajax,意思是异步脚本加载的,也就是数据不再源代码里面,而是在脚本代码中计算并从服务器中取得;
  3、所以用一般采集软件或者分析源代码是不可能采集到的。
全部回答
  • 1楼网友:西岸风
  • 2021-02-26 04:05
大神啊,不懂技术,我都是用采集器。。。
  • 2楼网友:风格不统一
  • 2021-02-26 03:26
你%1000的找错了,我无法帮你。你网页标签外面没数据,也就不会显示价格等信息。
还是给个样本你
(.*?)
\1或者$1提取(.*?)价格信息
网上搜索
Lungo 使用说明及心得 中文api
看了你就知道你上面只是一种布局。内容动态生成的。要结合网页中的脚本找。思路就是这样追问天猫的代码里就是没有数据啊,如果有数据的话我就用正则采集了追答id="J_PromoPrice" 这个就应该是数据,这种写法真无从下手了。采集也就采集出来J_PromoPrice这几个英文。。。。加密了!
  • 3楼网友:妄饮晩冬酒
  • 2021-02-26 02:52

我刚刚看了一下,天猫的确实是这样,没有将最终的促销价格的数字写在网页源代码里,你可以F12查看网页源代码,然后搜索tm-price-panel,这样你就可以进入到一个Javascript文件里,它的价格是在这个JS文件里动态算出来的,我截图截的这个和你的名字有点变化,但原理是一样的,然后你在这里啊一个断点,刷新网页就可以跟踪代码



跟踪到这个地方你就发现真正的价格出来了,在buyPrice后面的变量p里,所以,你要想得到最终促销的价格,光获取到网页的源代码还不够,你还得找到相应的JS然后和网站一样的调用,就行了
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯