2018年6月1日 星期五

python 3 抓取網頁(解決編碼問題) (獨家)

python 3 抓取網頁原始碼(解決編碼問題)


看了網路上的一堆資料,已經乏味,解決方式眾說紛紜,沒有一個是正確的辦法。


以下都是小編實際測試過的

有些人說 encode()有效
實測: 失效

有些人說 decode()有效
實測: 失效

有些人說 utf-8 有效
實測: 失效

有些人說 unicode有效
實測: 失效

有些人說 使用chardet
實測: 失效 (不僅失效,還把小編的預設編碼搞亂)

有些人說 要get_content參數
實測: 失效


漫長的解決道路上,沒有一個是完全有效的做法


後來小編找了一個字串處理
就變成萬用解法

拿Google官網原始碼來示範

這是失效的狀態


==============================================================


拿Google官網原始碼來示範

這是小編親自測試成功的狀態






By 藍雪科技-Sibe


有著作權,請勿轉載。若要分享,請註明本篇來源。





沒有留言:

張貼留言

Ollydbg 2.01 繁體中文版

Ollydbg 2.01 繁體中文版 Ollydbg 2.01 繁體中文版下載: Mega:   https://mega.nz/#!I2Qy1aQD!-T5zO3PaANjBHU73I4NlkY8SHMxRptbBV8TpmeFt1fo GD: h...