文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:144日期:2022-06-27 15:50:07
問題描述
上面的數據是從reuters數據集中取得7303個訓練集,用sklearn對其取tfidf特征,得到的結果都是0,這是怎么回事?
當我從這些數據中取一部分時,對于這些少部分數據能夠得到正確的tfidf結果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導致的
比如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
相關文章:
1. 為什么我ping不通我的docker容器呢???2. python3.x - python連oanda的模擬交易api獲取json問題第五問3. java - SSH框架中寫分頁時service層中不能注入分頁類4. nignx - docker內nginx 80端口被占用5. 關于docker下的nginx壓力測試6. docker鏡像push報錯7. angular.js - angular內容過長展開收起效果8. html5 - 百度echart官網下載的地圖json數據亂碼9. javascript - js代碼獲取驗證碼倒計時問題10. dockerfile - [docker build image失敗- npm install]
排行榜
