devilkate 发表于 2025-1-1 22:37:04

求教如何用LUA实现截取字符串中的中文内容

RT
由于某任务给出来的信息中间插了很多奇怪的特殊字符需要先把字符串里面的连续中文字符给抽取出来但是lua里面好像不是很好实现这个功能

求教一下大神该怎么写这个code

creat 发表于 2025-1-1 23:10:22

实现不了的时候可以考虑考虑当前的思路是否合适,有没有其他替代思路
毕竟工具是死的人是活的

devilkate 发表于 2025-1-2 08:53:46

creat 发表于 2025-1-1 11:10 PM
实现不了的时候可以考虑考虑当前的思路是否合适,有没有其他替代思路
毕竟工具是死的人是活的 ...

大佬给个思路吧。。。 脑回路能力有限

jarlyyn 发表于 2025-1-2 10:11:00

很多东西吧

回了你也不看,看了你也不听,听了有你也不学


kickuhead 发表于 2025-1-2 10:15:48

本帖最后由 kickuhead 于 2025-1-2 10:17 AM 编辑

有2个思路供参考:
1.分析unicode编码,汉字的编码在19968 - 40896

2.网上下载汉字一二三级文档,在里面对比,字库里存在的就是汉字

devilkate 发表于 2025-1-2 10:23:09

jarlyyn 发表于 2025-1-2 10:11 AM
很多东西吧

回了你也不看,看了你也不听,听了有你也不学

怎么说呢东西虽好但是我这种非专业的大龄人士是真的看不懂也不会用啊

jarlyyn 发表于 2025-1-2 11:16:13

devilkate 发表于 2025-1-2 10:23 AM
怎么说呢东西虽好但是我这种非专业的大龄人士是真的看不懂也不会用啊

...

大概整了个demo

基本没比我说的更简单的方法了。

kingyeli 发表于 2025-1-2 11:25:17

jarlyyn 发表于 2025-1-2 11:16 AM
大概整了个demo

基本没比我说的更简单的方法了。

为杰哥点赞hzi
但打开后,里面有好多?,应该是某些汉字没识别到,这些是否需要删除呢?

jarlyyn 发表于 2025-1-2 11:53:48

kingyeli 发表于 2025-1-2 11:25 AM
为杰哥点赞
但打开后,里面有好多?,应该是某些汉字没识别到,这些是否需要删除呢? ...

这就是123级字库啊

其实很多删除问题不大。

有?可能是字体不支持这些字

cangshu 发表于 2025-1-2 12:10:23

我也在想这个, 我的思路是这样,不知道是否可以:
如果这些"特殊字符"是特定的某些,那就一次次去掉字符串中的指定字符..最后剩下的不就是中文了..
页: [1] 2
查看完整版本: 求教如何用LUA实现截取字符串中的中文内容