rapidocr 提取汇总
rapidocr介绍
A cross platform OCR Library based on OnnxRuntime.
以下资料是根据RapidOCR获得2024中国互联网发展创新与投资大赛(开源)二等奖整理汇编的
支持识别的文种如下:
中、英、日、韩、中文繁体、泰卢固文、卡纳达文、泰米尔文、拉丁文、 阿拉伯字母 、斯拉夫字母、梵文
部分文种的使用国家或地区:
- 泰卢固文(Telugu):主要在印度的安得拉邦和特伦甘纳邦使用。
- 卡纳达文(Kannada):主要在印度的卡纳塔克邦使用。
- 泰米尔文(Tamil):主要在印度的泰米尔纳德邦、斯里兰卡的东北部、新加坡、马来西亚以及全球泰米尔社区使用。
- 拉丁文:作为古罗马帝国的官方语言,拉丁文对许多现代欧洲语言有深远影响。现代使用拉丁文的国家或地区不多,但拉丁文在学术、法律和宗教领域仍有使用。
- 阿拉伯字母:阿拉伯字母是阿拉伯语的书写系统,广泛用于中东和北非地区,包括沙特阿拉伯、埃及、伊拉克、叙利亚、约旦、黎巴嫩、阿尔及利亚、摩洛哥等国家。
- 斯拉夫