主頁spacer>spacerMergemill Pro 轉換文檔的文本格式和文本的字符編碼

spacer

文本文件格式和字符編碼轉換工具

輕鬆快速地轉換文本文件的字符編碼,和製表符分隔、CSV 或 XML 之間的文本格式

Share via Email Email

print friendly Print / PDF

Share on Facebook Facebook

Share on Twitter Twitter

space
文本文件格式之間的轉換

有許多方法可結構化文檔中的數據,其中 CSV 和製表符分隔的格式最廣泛被使用,因它們可以被多種應用軟體讀取,如試算表和資料庫。你應避免直接創建或編輯這些文檔,因製表符分隔的文檔使用的分隔符是空白字符,故容易無意中破壞格式結構。此外,逗號分隔的文檔(CSV)內的逗號必須按格式規定使用,以免數據值內的逗號被誤作為分隔符處理。使用類似 Mergemill Pro 的軟體來轉換文檔格式可避免這些問題。

XML 是常用的機器可讀格式,於資料庫應用程式之間亦具高度兼容性,故 CSV 或製表符分隔格式的文檔經常會轉換為 XML 文檔。XML 的其中一個重要優勢是它可包含字符編碼聲明,這使得它很容易被用作遷移多種語言的數據。例如,在 Microsoft Excel 不能識別 CSV 或 TSV 格式統一碼數據的情況下,以 Mergemill Pro 將它們轉換成 XML 或可解決數據匯入問題。


文本文件的字符編碼之間的轉換

為了代表文件中的文本字符,內碼數值與字符間必須使用某種「映射」或對應。取決於正在使用的語言和其他因素,不同的字符集須要其獨特的映射,如中文等的大字符集須使用多個字節來代表每個字符。如果一台電腦嘗試讀取的數據的編碼映射與預計的不同,便會出現一連串問題。因此要正確處理文本,確定它們之間的各種映射和字符編碼轉換是必要的。

過去大多數字符集和字符編碼方案通常只是支持一種語言或一小部分的語言,多語種軟體歷來皆使用特別的方法來支持多個字符編碼。簡單的解決方案應是把所有常用的語言和符號的字符合併成一個單一的通用編碼字符集,統一碼(Unicode)正是這樣的一個普遍編碼字符集。因為統一碼包含最常見的字符編碼,它有利於數據使用單一的編碼字符集。


Mergemill Pro 的優勢

Mergemill Pro 可輕易進行常見的文檔格式轉換,你只需選擇匯出 CSV,XML 或製表符分隔的文本格式的數據,你還可以編寫不超過幾行腳本來創建自定義輸出格式。Mergemill Pro 讓你輕鬆添加一個數據處理作業設定,使用新的「轉換數據檔案格式」輸出選項,並指定一個源檔案或檔案夾及輸出格式和位置,Mergemill Pro 便會快速複製數據項目名稱,以適當的格式讀取和寫入數據值,並按指定將輸出文本編碼。

文本編碼之間的轉換更容易。Mergemill Pro 允許你指定數據饋送編碼和輸出編碼,讓它在生成輸出的時候進行字符編碼轉換。Mergemill Pro 界面元素,內部數據儲存,並正在運行的作業所創建的中間文件都使用 Unicode UTF-8。

使用 Mergemill Pro 的最大好處是它的自動化功能及其強大的處理能力,讓你可做的遠遠超過簡單的轉換。你可以設定一個檔案夾,讓 Mergemill Pro 在某些預定的時間內自動處理該檔案夾內的文件。

spacer

了解更多...

spacer

返回頁首

軟體功能spacer::spacer下載專區spacer::spacer購買spacer::spacer軟體支援spacer::spacer視頻教程spacer::spacer標籤指南spacer::spacer網站導覽


版權所有 · 不得轉載 © 2001-2017 Cross Culture Ltd.