🌐 语言检测工具

自动检测输入文本的语言种类,支持中文、英文、日文、韩文、俄文、阿拉伯文等。通过 Unicode 字符范围匹配,显示各语言占比和置信度分析。

📝 输入文本
在下方输入或粘贴需要检测语言的文本:
📋 Unicode 语言范围说明
检测基于以下 Unicode 区块范围:
中文(CJK统一表意文字): U+4E00–U+9FFF, U+3400–U+4DBF
日文(假名): U+3040–U+309F(平假名), U+30A0–U+30FF(片假名)
韩文(谚文): U+AC00–U+D7AF, U+1100–U+11FF
俄文(西里尔字母): U+0400–U+04FF
阿拉伯文: U+0600–U+06FF
英文(拉丁字母): U+0041–U+005A, U+0061–U+007A
❓ 常见问题
工具通过扫描每个字符的 Unicode 码点来判断所属语言范围。例如 U+4E00–U+9FFF 范围的字符识别为中文。它不依赖外部 API,完全在浏览器端运行,保护隐私。
越南文使用扩展拉丁字母(含附加符号),这些字符实际在拉丁扩展 Unicode 区块中,本工具将基础拉丁字母统一显示为"英文/拉丁文"。如需精确识别可补充特定的拉丁扩展字符范围。
基于 Unicode 范围的语言检测对区分中日韩等使用不同字符集的语言比较准确,但对共享字符集的语言(如英文和其他拉丁字母语言)无法精确区分,仅供参考。