网站首页/硬件软件列表/内容

win10微软全拼输入法导入搜狗词库办法图文解析教程

硬件软件2024-05-09阅读
输入法是指为将各种符号输入电子信息设备(如计算机、手机)而采用的编码方法。在中国、日本,为了将汉字输入计算机或手机等电子设备则需要中文输入法。汉字输入的编码方法,基本上都是按照音、形、义完成汉字的输入的。

windows 10系统内置的微软拼音输入法简洁干净与系统融合较高,体验非常不错,但相比主流中文输入法他的词库方面较为薄弱,对于习惯使用词库联想输入用户真的很难更改。而现在有一款开源免费的输入法词库转换软件可以解决各种输入法词库互相迁移的问题,所以将强大的搜狗词库转换到微软拼音也不难,下面带来详细的转换方法,需要的用户一起来看看吧。

一、搜狗输入法词库获取方法

基础词库

切换到“搜狗输入法”,然后进入设置界面,找到“属性设置->词库”点击“导出/备份”即可!

win10微软拼音输入法导入搜狗词库方法图解教程1

自定义词库

可以到搜狗官方网站下载scel格式的细胞词库或用户整理的《搜狗细胞词库scel全量包》。

win10微软拼音输入法导入搜狗词库方法图解教程2

二、搜狗词库转换微软拼音

1、首先下载《深蓝词库转换器》(可能会报毒,开源软件安全性是经得起考验的!)

2、运行软件,选择你的搜狗输入法词库文件位置(默认是.txt类型词库,需切换一下)

软件支持批量转换,可以一次拖拽多个词库文件或者按住 Ctrl 选择多个文件。

win10微软拼音输入法导入搜狗词库方法图解教程3

3、第一个下拉框选择需要转换的词库类型,搜狗有三个分别是:txt、bin、scel根据实际情况选择。

4、第二个下拉框选择转换后的词库类型,选择“Win1o微软拼音(自学习词库)”,点击转换即可完成!

win10微软拼音输入法导入搜狗词库方法图解教程4

命令行模式转换方法

深蓝词库转换.exe -i:输入的词库类型 词库路径1 词库路径2 词库路径3 -o:输出的词库类型 输出词库路径 -c:编码文件路径

win10微软拼音输入法导入搜狗词库方法图解教程5

输入和输出的词库类型如下:
sgpy    搜狗拼音txt
scel    搜狗细胞词库scel
sgpybin 搜狗拼音备份词库bin
qqpy    QQ拼音
qpyd    QQ分类词库qpyd
qcel    QQ分类词库qcel
qqwb    QQ五笔
qqpye   QQ拼音英文
bdpy    百度拼音
xiaoxiao        小小输入法
bdict   百度分类词库bdict
ggpy    谷歌拼音
gboard  Gboard
pyjj    拼音加加
win10mspy       Win10微软拼音(自定义短语)
win10mswb       Win10微软五笔(自定义短语)
win10mspyss     Win10微软拼音(自学习词库)
mspy    微软拼音
bing    必应输入法
fit     FIT输入法
plist   Mac简体拼音
rime    Rime中州韵
zgpy    华宇紫光拼音
uwl     紫光拼音词库uwl
libpy   libpinyin
pyim    Chinese-pyim
sxpy    手心输入法
xlpy    新浪拼音
jd      极点五笔
jdzm    极点郑码
xywb    小鸭五笔
yahoo   雅虎奇摩
ld2     灵格斯ld2
wb86    五笔86版
wb98    五笔98版
cjpt    仓颉平台
emoji   Emoji
bdsj    百度手机或Mac版百度拼音
bdsje   百度手机英文
bcd     百度手机词库bcd
qqsj    QQ手机
ifly    讯飞输入法
self    自定义
word    无拼音纯汉字

例如要将C:\test.scel和C:\a.scel的搜狗细胞词库转换为D:\gg.txt的谷歌拼音词库,命令为:
深蓝词库转换.exe -i:scel C:\test.scel C:\a.scel -o:ggpy D:\gg.txt

 

例如要将C:\test.scel和C:\a.scel的搜狗细胞词库转换为D:\temp文件夹下的谷歌拼音词库test.txt和a.txt,命令为:
深蓝词库转换.exe -i:scel C:\test.scel C:\a.scel -o:ggpy D:\temp\*

 

例如要将C:\test\*.scel的搜狗细胞词库转换为D:\temp文件夹下的谷歌拼音词库,命令为:
深蓝词库转换.exe -i:scel C:\test\*.scel -o:ggpy D:\temp\*

 

对于导出词库为Rime输入法的,可以通过-ct:pinyin/wubi/zhengma设置编码,也可通过-os:windows/macos/linux设置适用的操作系统

 

自定义格式的参数如下:
-f:213,|byyn
213 这里是设置拼音、汉字和词频的顺序,213表示1汉字2拼音3词频,必须要有3个
, 这里是设置拼音之间的分隔符,用逗号分割
| 这里是设置汉字拼音词频之间的分隔符,用|分割
b 这里是设置拼音分隔符的位置,有lrbn四个选项,l表示左包含,r表示右包含,b表示两边都包含,n表示两边都不包含
yyn 这里是设置拼音汉字词频这3个是否显示,y表示显示,b表示不显示,这里yyn表示显示拼音和汉字,不显示词频
例如要将一个qpyd词库转换为自定义格式的文本词库,拼音之间逗号分割,拼音和词之间空格分割,不显示词频,同时使用自定义的编码文件code.txt命令如下:

 

三、微软拼音词库导入方法

微软拼音支持一次导入的词库数量不能太大,可能上限是5W个词条,如果源词库的词条数太多用深蓝词库转换会被分割成多个文件,可以一个一个导入。

1、进入“设置->时间和语言->语言”,点击首选语言中的“中文(简体,中国)”后,再点击“选项”。

win10微软拼音输入法导入搜狗词库方法图解教程6

2、进入“语言选项”,点击“微软拼音->选项->词库和自学习->导入自学习词汇”选择转换的“.dat”格式词库即可。

win10微软拼音输入法导入搜狗词库方法图解教程7



相关阅读