KeyarchOS×libexttextcat-tools-3.4.5-2:国产化系统下的文本分类工具落地,助力多语言场景 | 浪潮信息KOS
浪潮信息KOS是浪潮信息基于Linux Kernel、OpenAnolis等开源技术自主研发的一款服务器操作系统,支持x86、ARM等主流架构处理器,性能和稳定性居于行业领先地位,具备成熟的 CentOS 迁移和替换能力,可满足云计算、大数据、分布式存储、人工智能、边缘计算等应用场景需求。详细介绍见官网链接。libexttextcat-tools是一个与文本分类和语言检测相关的工具集合,它基于li
1 概述
浪潮信息KOS是浪潮信息基于Linux Kernel、OpenAnolis等开源技术自主研发的一款服务器操作系统,支持x86、ARM等主流架构处理器,性能和稳定性居于行业领先地位,具备成熟的 CentOS 迁移和替换能力,可满足云计算、大数据、分布式存储、人工智能、边缘计算等应用场景需求。详细介绍见官网链接https://zh.ieisystem.com/product/kos/9453.html。
libexttextcat-tools是一个与文本分类和语言检测相关的工具集合,它基于libexttextcat库。libexttextcat是一个用于语言检测的开源库,由OpenOffice项目开发,并被LibreOffice和其他应用程序广泛使用。libexttextcat-tools提供了命令行工具,可以方便地进行文本语言检测。详细见官网https://github.com/apache/openoffice/tree/main/textcat。
2 安装环境
2.1 操作系统环境
版本信息:KeyarchOS 5.8sp2
硬件平台:aarch64

2.2工具版本
libexttextcat-tools-3.4.5-2
https://github.com/apache/openoffice/tree/main/textcat
厂商名称:OpenOffice
3 安装与测试
3.1 root权限下安装libexttextcat-tools-3.4.5-2
在http://rpmfind.net/linux/rpm2html/search.php?query=libexttextcat&submit=Search+...&system=&arch=下载libexttextcat的rpm包

在http://rpmfind.net/linux/rpm2html/search.php?query=libexttextcat-tools&submit=Search+...&system=&arch=下载libexttextcat-tools的rpm包

将下载的rpm包上传至服务器

yum install libexttextcat-3.4.5-2.el8.aarch64.rpm安装libexttextcat的rpm包

yum install libexttextcat-tools-3.4.5-2.el8.aarch64.rpm安装libexttextcat-tools的rpm包

执行echo "This is a test." | createfp

安装完成。
3.2测试
首先创建一个简单的文本文件:
echo "Hello, how are you?" > /home/training_data/english/text1.txt

将文件重定向给createfp:createfp < text1.txt

上述表明安装成功。
更多推荐
所有评论(0)