📁 Unicode 字符信息查询

输入任意字符查看其 Unicode 编码信息,或输入码点(十六进制)进行查询。支持按码点范围浏览。

🔍 查询字符

📚 按码点范围浏览

📖 常用 Unicode 范围

U+0041 - U+005A
拉丁大写字母 (A-Z)
U+0061 - U+007A
拉丁小写字母 (a-z)
U+4E00 - U+9FFF
CJK 统一表意文字
U+3000 - U+303F
CJK 符号和标点
U+FF00 - U+FFEF
全角/半角形式
U+1F300 - U+1F9FF
杂项符号和 Emoji
U+0600 - U+06FF
阿拉伯语
U+3040 - U+309F
平假名
U+30A0 - U+30FF
片假名
U+AC00 - U+D7AF
韩文音节
U+2150 - U+218F
数字形式
U+2100 - U+214F
字母式符号

Unicode 编码简介:Unicode 为每个字符分配唯一的码点(Code Point),范围 U+0000 至 U+10FFFF。UTF-8 是可变长度编码(1-4 字节),UTF-16 为 2 或 4 字节。

平面说明:BMP(基本多语言平面)U+0000 至 U+FFFF 包含常用字符;辅助平面 U+10000 以上包含 Emoji、古文字等。

❓ 常见问题
直接输入或粘贴字符到搜索框,工具会显示该字符的码位(U+XXXX)、名称、所属 Unicode 块、类别(字母/符号/标点等)、UTF-8/UTF-16 字节数、HTML 实体、十进制/十六进制等多种表示形式。
Unicode 为全球所有文字系统中的每个字符分配了唯一编号,称为"码位"(code point),用 U+ 后跟十六进制数表示,如 U+4E2D 是"中"字。范围从 U+0000 到 U+10FFFF(理论上限)。
UTF-8 用 1-4 字节变长编码(ASCII 字符 1 字节,中文 3 字节),向后兼容 ASCII。UTF-16 用 2 或 4 字节(BMP 内字符 2 字节),更节省空间但对 ASCII 不友好。现代 Web 几乎统一使用 UTF-8。
HTML 实体是用 & 开头、; 结尾的字符引用方式,例如 中 或 中 都表示"中"字。常用于在 HTML 中插入特殊字符,避免编码问题。常见字符还有命名实体如 &(&)。