文章詳情頁
python - 用sklearn求大文本的tfidf特征?
瀏覽:136日期:2022-06-27 15:50:07
問題描述
上面的數(shù)據(jù)是從reuters數(shù)據(jù)集中取得7303個(gè)訓(xùn)練集,用sklearn對(duì)其取tfidf特征,得到的結(jié)果都是0,這是怎么回事?
當(dāng)我從這些數(shù)據(jù)中取一部分時(shí),對(duì)于這些少部分?jǐn)?shù)據(jù)能夠得到正確的tfidf結(jié)果。
問題解答
回答1:上代碼,可能是你精度太低或者min_count導(dǎo)致的
比如詞頻是1,總詞數(shù)1e9,對(duì)應(yīng)的tf就是1e-9,被忽略了。
相關(guān)文章:
1. docker - 如何修改運(yùn)行中容器的配置2. javascript - Web微信聊天輸入框解決方案3. 請(qǐng)教各位大佬,瀏覽器點(diǎn) 提交實(shí)例為什么沒有反應(yīng)4. docker images顯示的鏡像過多,狗眼被亮瞎了,怎么辦?5. javascript - 關(guān)于audio標(biāo)簽暫停的問題6. javascript - history.replaceState()無法改變query參數(shù)7. javascript - 移動(dòng)端textarea不能上下滑動(dòng),該怎么解決?8. javascript - 為什么form表單提交沒有跨域問題,但ajax提交有跨域問題?9. javascript - Ajax加載Json時(shí),移動(dòng)端頁面向左上角縮小一截兒,加載完成后才正常顯示,這該如何解決?10. javascript - 音頻加載問題
排行榜

熱門標(biāo)簽