易语言数据清洗(1),将网页中的文本内容转换为json数据()

file

前言

在云控系统的设备列表中,展示了设备型号。
怎么转换为工业产品名称呢?

file

由于市场上的手机型号太多,逐个查询和判断是非常费劲的。
如果有一个数据库,能够保存手机型号和对应的工业产品名称,从这个库里查询就方便了。

去搜索了一下,好像没有这样的数据库。
刚好发现有个页面收录了这样的数据,不过不是json格式。需要清洗一下录入数据库

file

清洗方式

有多种方式可以实现。
例如,可以使用python写一个爬虫,爬取页面的Dom层数据。

file

还可以使用php写一个爬虫来爬取。

此外,还可以使用易语言来实现。
经过思考,易语言实现是最简单的。
由于页面数据的格式比较固定,直接复制到易语言程序中,分割字符串后经过简单的筛选剔除无用手机,就可以得到想要的数据。然后组装成json格式。

安装易语言和开发工具

安装易语言5.92版本。

file

安装精易的易语言助手,启用需要的开发插件

file

下载精易模块源码,去掉注释重新编译一次

编写数据清洗工具

创建一个窗口程序,引入精易模块

file

左边的输入框放网页上复制的数据,点击清洗按钮,将生成的json数据显示在右侧的输入框内。
点击入库按钮,将数据存入远程的Mysql数据库。

清洗数据的全部代码:
file

开发期间用到了将json数据反向生成易语言代码的工具:
file

将网页的数据,复制到左侧的输入框里,进行清洗:

file

将右侧的内容复制到chrome浏览器的JSON格式化工具扩展里,格式化一下,检查数据是否正确

file

将数据提交到数据库

易语言数据清洗(2),将json数据通过api接口提交到数据库

1. 官方交流QQ群,添加多个不批。建议使用安卓手机或电脑申请。
飞云脚本圈: 586333520飞云脚本圈
Auto.js学习交流③群:286635606
Auto.js学习交流②群:712194666(满员)
IOS免越狱自动化测试群:691997586
2. 盗版,破解有损他人权益和违法作为,请各位会员支持正版。
3. 本站部分资源来源于用户上传和网络搜集,如有侵权请提供版权证明并联系站长删除。
4.如未特别申明,本站的技术性文章均为原创,未经授权,禁止转载/搬运等侵权行为。
5.全站所有付费服务均为虚拟商品,购买后自动发货。售出后概不接受任何理由的退、换。注册即为接受此条款。
6.如果站内内容侵犯了您的权益,请联系站长删除。
飞云脚本 » 易语言数据清洗(1),将网页中的文本内容转换为json数据()

企业级大数据智能营销管理系统

了解详情