python 3 抓取網頁原始碼(解決編碼問題)
看了網路上的一堆資料,已經乏味,解決方式眾說紛紜,沒有一個是正確的辦法。
以下都是小編實際測試過的
有些人說 encode()有效
實測: 失效
有些人說 decode()有效
實測: 失效
有些人說 utf-8 有效
實測: 失效
有些人說 unicode有效
實測: 失效
有些人說 使用chardet
實測: 失效 (不僅失效,還把小編的預設編碼搞亂)
有些人說 要get_content參數
實測: 失效
漫長的解決道路上,沒有一個是完全有效的做法
後來小編找了一個字串處理
就變成萬用解法
拿Google官網原始碼來示範
這是失效的狀態
==============================================================
拿Google官網原始碼來示範
這是小編親自測試成功的狀態
By 藍雪科技-Sibe
有著作權,請勿轉載。若要分享,請註明本篇來源。