UTF-16(16 位 Unicode 转换格式)是一种把 Unicode 字符编码为16 位代码单元(code unit)序列的字符编码方式。它对常用字符通常用 1 个 16 位单元表示;对超出基本多文种平面(BMP)的字符(如部分表情符号、罕见文字)会用代理项对(surrogate pair)占 2 个 16 位单元。
(注:UTF-16 还有大小端之分:UTF-16LE / UTF-16BE,常可用 BOM 标记字节序。)
/ˌjuːtiːˈɛf sɪksˈtiːn/
The file is encoded in UTF-16.
这个文件使用 UTF-16 编码。
If you read the text as UTF-8 but it’s actually UTF-16, you may see garbled characters or errors.
如果你把文本按 UTF-8 去读取,但它其实是 UTF-16,就可能出现乱码或报错。
UTF 是 Unicode Transformation Format(Unicode 转换格式)的缩写;16 表示它以 16 位为基本编码单位。UTF-16 的设计目标之一是让大量常用字符能以固定宽度的 16 位单元高效表示,同时也能通过代理项机制覆盖全部 Unicode 码位。