有什么适合新手爬虫的网站(求助 刚学python 学习爬虫)

建站教程 1年前 (2023) admin
58 0

求助 刚学python 学习爬虫

url = "http://www.douban.com/" request = urllib.request.Request(url) response = urllib.request.urlopen(request) data = response.read() print(data) 先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出, 中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\ 像这样 最后一句改成这样 print(data.decode('utf-8')) 有这样的报错 UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence 求助,怎么解决?我看到关于python3的教程 他们输出都是正常的

版权声明:admin 发表于 2023年1月12日 am6:57。
转载请注明:有什么适合新手爬虫的网站(求助 刚学python 学习爬虫) | 热豆腐爱做网站导航

相关文章