?? wf.py
字號(hào):
import codecs, re
f1=codecs.open(r"./T0263_utf8.txt", "r", "utf8")
f2=codecs.open(r"./T0263_wfrq.txt", "w", "utf8")
l=f1.read()
f1.close()
d={}
pattern=re.compile(r"(\[[^]]*\]|.)")
sl=pattern.findall(l)
i=0
for k in sl:
i=i+1
if k in d:
d[k]=d[k]+1
else:
d[k]=1
wf=d.items()
wf.sort(lambda x, y : cmp(x[1],y[1]))
wf.reverse()
print>>f2, 'num=',i
for w in wf:
word=w[0]
freq=w[1]
print>>f2, word, freq
f2.close()
?? 快捷鍵說(shuō)明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -