文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:117日期:2022-06-27 15:50:07
問題描述
上面的數據是從reuters數據集中取得7303個訓練集,用sklearn對其取tfidf特征,得到的結果都是0,這是怎么回事?
當我從這些數據中取一部分時,對于這些少部分數據能夠得到正確的tfidf結果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導致的
比如詞頻是1,總詞數1e9,對應的tf就是1e-9,被忽略了。
相關文章:
1. python - 爬蟲模擬登錄后,爬取csdn后臺文章列表遇到的問題2. python bottle跑起來以后,定時執行的任務為什么每次都重復(多)執行一次?3. javascript - angular使從elastichearch中取出的文本高亮顯示,如圖所示4. 前端 - 誰來解釋下這兩個 CSS selector 區別5. javascript - vue2如何獲取v-model變量名6. html5 - HTML代碼中的文字亂碼是怎么回事?7. javascript - ios返回不執行js怎么解決?8. javascript - 求幫助 , ATOM不顯示界面!!!!9. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處10. 視頻文件不能播放,怎么辦?
排行榜
