re.findall(r'\"view price\"\:\"[\d\.]*\"',html)
re.findall():搜索字符串,以列表类型返回全部能匹配的子串,上式中“view price\”来自于:点进任一商品页面,右键查看源代码,商品价格的html属性为view price,商品名称的属性为raw title,‘\"’匹配双引号,‘view_price’匹配view_price,‘\:’匹配冒号,‘\d\.’匹配一个整数加一个小数点,‘[]*’*号匹配中括号内的正则表达式,商品名称同理,其中‘.*?’用于匹配前面频繁或重复出现符号的非贪婪版本,这里用于匹配最短数目的同性质字符,如下。
(r'')r表示单引号内全为正则表达式符号,如\n要在正则表达式中表示要加个反斜杠‘\\n’,加个r就可以直接写\n
温馨提示:答案为网友推荐,仅供参考