博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
paip.输入法英文词库的处理 python 代码 o4
阅读量:5291 次
发布时间:2019-06-14

本文共 1447 字,大约阅读时间需要 4 分钟。

paip.输入法英文词库的处理 python 代码 o4
目标是eng>>>中文>>atian
当输入非atian词的时候儿,能打印出  atian pinyin >>>english提示..  ,在根据英文输入..
=====下载源词库
要下载一个格式好的词库文件还是很困难的..几乎没..只好自己写兰...
下载一个-GRE 8k词库..excel,删除不要的datasheet,导入mysql
格式如下:
abandon    v./n.放弃;放纵     
============需要做如下的数据清理:
分割出词性,分割出多个的中文词..如下
abandon    放弃         v./n.
abandon    放纵         v./n.
作者: 老哇的爪子Attilax 艾龙,  EMAIL:1466519819@qq.com
来源:http://blog.csdn.net/attilax
====对应的代码python
conn2 = mysql.connector.connect(user=user, password=pwd, host=host, database=db)
cursorInsert = conn2.cursor()
import dicUtil
from dicUtil import *
#this must match field amout and order in sql
for (en, cn, id) in cursor:
    if(hasTsisin(cn)):
        tsisin=left_ByDot(cn)
        cnstr=right_ByDot(cn)
    else:
        tsisin="nonx."
        cnstr=cn
    cnstr=cnstr.replace(";", ",")
    cnstr=cnstr.replace(",", ",")  
    
    cnstr_a=cnstr.split(",")
#    for index8 in range(len(list)):
#        print index8
#      print list[index8]
    print (" "+tsisin+"---"+cnstr)
    for index,v in enumerate(cnstr_a):
      #  print ()index
      #  print (v) strip
        sql=" insert into grejx_def (en,cn,nAdjV)values('@en','@cn','@adj')"
        sql=sql.replace("@en", trim(en)).replace("@cn", v.strip()).replace("@adj", tsisin.strip())
        print(sql)
        reslt=cursorInsert.execute(sql)
        
        print("---insert resl:")
        print(reslt)
        conn2.commit()
       
def hasTsisin(str):
    try:
        lastIndex=str.rindex(".")
        #print(lastIndex)
        return True
    except :
        print("--no has dot"+ str)
        return False       
参考
excel背单词-TOEFL-GRE - 下载频道 - CSDN.NET

转载于:https://www.cnblogs.com/attilax/p/5964029.html

你可能感兴趣的文章
数组去重一步到位
查看>>
HDU 4671 Backup Plan 构造
查看>>
linux下编译openjdk8
查看>>
【python】--迭代器生成器装饰器
查看>>
Pow(x, n)
查看>>
安卓当中的线程和每秒刷一次
查看>>
MySQL Proxy
查看>>
关于Vue的组件的通用性问题
查看>>
随机颜色值
查看>>
每日一库:Modernizr.js,es5-shim.js,es5-safe.js
查看>>
目录相关的操作
查看>>
解决虚拟机vmware安装64位系统“此主机支持 Intel VT-x,但 Intel VT-x 处于禁用状态”的问题...
查看>>
C++----练习--引用头文件
查看>>
11.基本包装类型
查看>>
ajax连接服务器框架
查看>>
wpf样式绑定 行为绑定 事件关联 路由事件实例
查看>>
利用maven管理项目之POM文件配置
查看>>
用HttpCombiner来减少js和css的请问次数
查看>>
FUSE-用户空间文件系统
查看>>
将tiff文件转化为jpg文件并保存
查看>>