久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python:爬蟲的中文編碼問題?

瀏覽:171日期:2022-08-26 10:56:16

問題描述

爬取中文網頁后正則匹配出中文,得打UTF-8的編碼字符網頁爬蟲 - Python:爬蟲的中文編碼問題?

將其輸出為.csv文件網頁爬蟲 - Python:爬蟲的中文編碼問題?

在.CSV中顯示為亂碼網頁爬蟲 - Python:爬蟲的中文編碼問題?

用記事本打開.csv又可以正常顯示為中文網頁爬蟲 - Python:爬蟲的中文編碼問題?

有沒有大神指點是怎么一回事?怎樣才能在Excel里直接看到中文?

問題解答

回答1:

簡單地方法是用pandas的to_excel方法轉化成.xlsx文件,因為.xlsx默認編碼是默認支持Excel的,區別當然是無法用記事本打開。

import pandas as pda = pd.read_csv(’./test.csv’)a.to_excel(’./test_output.xlsx’, index=False)a.to_excel(’./test_output.csv’, index=False)

我這里沒有windows可以測試,可以嘗試寫入編碼為gb2312或者gbk試試。

表格文件類I/O的話其實pandas更方便一點。

回答2:

abs1=abs1.decode().encode(’gbk’)

回答3:

excel默認使用的是GBK編碼。

回答4:

新建一個excel文件,然后點 數據 自文本,導入csv文件

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 阳山县| 楚雄市| 林周县| 洪洞县| 五河县| 泸溪县| 峡江县| 克山县| 乡宁县| 盐津县| 滁州市| 夏河县| 浦东新区| 聂拉木县| 迁西县| 乐平市| 丹巴县| 凤阳县| 凌云县| 个旧市| 天津市| 方正县| 开原市| 邵阳县| 虞城县| 彭泽县| 黑河市| 高尔夫| 南和县| 洮南市| 仪征市| 融水| 东安县| 兴安县| 镇江市| 永仁县| 慈利县| 蓝田县| 尤溪县| 喜德县| 汾西县|