Python無法正確排序unicode。Strcoll沒有幫助
顯然,在所有平臺(tái)上進(jìn)行排序的唯一方法是使用具有PyICU綁定的ICU庫(在PyPI上為PyICU)。
在OS X:上sudo port installpy26-pyicu,請注意此處描述的錯(cuò)誤:https ://svn.macports.org/ticket/23429(使用Macports的樂趣)。
不幸的是,嚴(yán)重缺乏PyICU的文檔,但是我設(shè)法找出了它的完成方法:
import PyICUcollator = PyICU.Collator.createInstance(PyICU.Locale(’pl_PL.UTF-8’))print [i for i in sorted([u’a’, u’z’, u’?’], cmp=collator.compare)]
這使:
[u’a’, u’?’, u’z’]
另一個(gè)優(yōu)點(diǎn)-@bobince:它是線程安全的,因此在設(shè)置請求方式的語言環(huán)境時(shí)并非沒有用。
解決方法我在OSX和Linux上的Python 2.5.1和2.6.5中使用Unicode排序規(guī)則對列表進(jìn)行排序時(shí)遇到問題。
import locale locale.setlocale(locale.LC_ALL,’pl_PL.UTF-8’)print [i for i in sorted([u’a’,u’z’,u’?’],cmp=locale.strcoll)]
應(yīng)該打印:
[u’a’,u’?’,u’z’]
而是打印出來:
[u’a’,u’?’]
總結(jié)一下-好像strcoll壞了。嘗試了各種類型的變量(例如非Unicode編碼的字符串)。
我做錯(cuò)了什么?
最好的問候,Tomasz Kopczuk。
相關(guān)文章:
1. ASP中常用的22個(gè)FSO文件操作函數(shù)整理2. 無線標(biāo)記語言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁3. ASP調(diào)用WebService轉(zhuǎn)化成JSON數(shù)據(jù),附j(luò)son.min.asp4. .Net core 的熱插拔機(jī)制的深入探索及卸載問題求救指南5. SharePoint Server 2019新特性介紹6. html清除浮動(dòng)的6種方法示例7. 讀大數(shù)據(jù)量的XML文件的讀取問題8. ASP.NET Core 5.0中的Host.CreateDefaultBuilder執(zhí)行過程解析9. React+umi+typeScript創(chuàng)建項(xiàng)目的過程10. Vue+elementUI下拉框自定義顏色選擇器方式
