主页spacer>spacerMergemill Pro 转换文档的文本格式和文本的字符编码

spacer

文本文件格式和字符编码转换工具

轻松快速地转换文本文件的字符编码,和制表符分隔、CSV 或 XML 之间的文本格式

Share via Email Email

print friendly Print / PDF

Share on Facebook Facebook

Share on Twitter Twitter

space
文本文件格式之间的转换

有许多方法可结构化文档中的数据,其中 CSV 和制表符分隔的格式最广泛被使用,因它们可以被多种应用软件读取,如试算表和数据库。你应避免直接创建或编辑这些文档,因制表符分隔的文档使用的分隔符是空白字符,故容易无意中破坏格式结构。此外,逗号分隔的文档(CSV)内的逗号必须按格式规定使用,以免数据值内的逗号被误作为分隔符处理。使用类似 Mergemill Pro 的软件来转换文档格式可避免这些问题。

XML 是常用的机器可读格式,于数据库应用程式之间亦具高度兼容性,故 CSV 或制表符分隔格式的文档经常会转换为 XML 文档。使用 XML 的一个重要好处是你可以指定内容的字符编码,这使得它很容易被用作迁移多种语言的数据。例如,在 Microsoft Excel 不能识别 CSV 或 TSV 格式统一码数据的情况下,以 Mergemill Pro 将它们转换成 XML 或可解决数据导入问题。


文本文件的字符编码之间的转换

为了代表文件中的文本字符,内码数值与字符间必须使用某种「映射」或对应。取决于正在使用的语言和其他因素,不同的字符集须要其独特的映射,如中文等的大字符集须使用多个字节来代表每个字符。如果一台计算机尝试读取的数据的编码映射与预计的不同,便会出现一连串问题。因此要正确处理文本,确定它们之间的各种映射和字符编码转换是必要的。

过去大多数字符集和字符编码方案通常只是支持一种语言或一小部分的语言,多语种软件历来皆使用特别的方法来支持多个字符编码。简单的解决方案应是把所有常用的语言和符号的字符合并成一个单一的通用编码字符集,统一码(Unicode)正是这样的一个普遍编码字符集。因为统一码包含最常见的字符编码,它有利于数据使用单一的编码字符集。


Mergemill Pro 的优势

Mergemill Pro 可轻易进行常见的文档格式转换,你只需选择导出 CSV,XML 或制表符分隔的文本格式的数据,你还可以编写不超过几行脚本来创建自定义输出格式。 Mergemill Pro 让你轻松添加一个数据处理作业设定,使用新的「转换数据文件格式」输出选项,并指定一个源文件或文件夹及输出格式和位置,Mergemill Pro 便会快速复制数据项目名称,以适当的格式读取和写入数据值,并按指定将输出文本编码。

文本编码之间的转换更容易。Mergemill Pro 允许你指定数据馈送编码和输出编码,让它在生成输出的时候进行字符编码转换。Mergemill Pro 界面元素,内部数据存储,并正在运行的作业所创建的中间文件都使用 Unicode UTF-8。

使用 Mergemill Pro 的最大好处是它的自动化功能及其强大的处理能力,让你可做的远远超过简单的转换。你可以设定一个文件夹,让 Mergemill Pro 在某些预定的时间内自动处理该文件夹内的文件。

spacer

了解更多...

spacer

返回页首

软件功能spacer::spacer下载专区spacer::spacer购买spacer::spacer软件支援spacer::spacer视频教程spacer::spacer标签指南spacer::spacer网站导览


版权所有 · 不得转载 © 2001-2017 Cross Culture Ltd.