起点软件园:打造绿色软件,免费软件下载基地!
您的位置:起点软件下载电脑软件系统软件MDX词典格式转化软件GetDict 2.3 中文版

MDX词典格式转化软件GetDict 2.3 中文版 MDX词典格式转化软件GetDict 2.3 中文版

软件大小:47KB

用户评分:

软件类型:国产软件

运行环境:Win All

软件语言:简体中文

软件分类:系统软件

更新时间:2014-03-14 13:55:44

授权方式:免费软件

插件情况:无 插 件

【概括介绍】
GetDict是一款非常不错的MDX词典转化工具,可以将Mdict的mdx格式转化为可编辑的txt文本格式,供用户编辑使用。

【基本介绍】
mdx是MDict软件的词典文件,相当于一个电子书。它无法转换成视频,因为都是文本文件。只要手机安装MDict,就可以打开mdx字典了,在电脑端可以使用Mdx文件制作工具MdxBuilder进行编辑。

【MDict词库制作方法】
第一步是要从MDX格式的词库中导出txt格式的文本,才能对它进行编辑,几经查找和尝试,终于找到GetDict.exe,导出了txt文本,它是每个单词一行的Html+C的格式,方便把不同来源的单词分开,但不是MDX所要求的源文本。为了把无用的单词去掉,我需要对它进行处理。由于这个文件太大(约890M),家里的电脑不能装UltrEdit,其它软件都打不开它(单位的电脑能装,但处理效率太低),经过研究,终于找到了Linux下的Grep可以完成此项任务,并且速度超快。由于合集中的词库太多,都需要手工选择,所以还是花了好几个小时的时间才把每个词库分开,分别保存为一个一个的文件。从中选出了15个对我可能有用的词库,进行下一步的处理。(由于不熟悉,没有人指导,都靠自己摸索,前面这些工作花了一整天加半个晚上的时间)。

第二步是对那15个字库的源文本进行加工。为把源文本转换为MDX需要的格式,使用了MdxBuilder,先将其转换为MDX文件,选项里选上“Allow export to text”,然后用用MdxExport.exe将上一步得到的mdx文件转换为txt文件,即得到了MDX所要求的“每单词三行”文本格式。但里面有很多\< \> \" \& 需要替换为 < > " &后才能用。这个环节又花了半个晚上加一上午,才把15个文件整理完毕。这个过程使我对正则表达式有了一些了解,对NotePad++也熟悉了一些:NotePad++的搜索替换速度很快,能使用正则表达式,但缺点是文件太大后(约100M),经常执行一半就异常退出了。为了处理一些大文件(约140M),我不得不把文件分成两个,再进行处理。

第三步,使用MdxBuilder将处理完毕的词库文本文件进行转换,得到最终MDX格式的词库文件。完成所有任务。

用户评论

(您的评论需要经过审核才能显示)0人参与,0条评论
140

最新评论

还没有评论,快来抢沙发吧!