水。
「把测试包打包发过去吧,收钱睡觉。」
楚戈按了几下滑鼠,把生成好的程序文件压缩。
他点开那个黑客论坛的私信界面,准备给对方发过去。
就在这时,对方的头像闪了起来。
发来了一个十几兆的压缩包。
紧接着是一条留言:
【兄弟,代码如果跑通了,顺手帮个忙。这是我们网站初期的两万条原始图片数据标签,你用你的新程序跑一遍,把里面的乱码和错误标签筛出来,跑完没问题,一千五百块钱我立刻打你卡上。】
楚戈愣了一下。
他点开那个压缩包,解压。
打开里面的文本文档。
只看了一眼,楚戈的脸就黑了。
密密麻麻的文本,几百页。
里面全是不规则的数据。
有些是正常的中文标签风景,人物。
有些是乱码%amp;:*#¥。
还有些是拚写错误的英文单词,甚至是半角全角混杂的标点符号。
这根本不是程式设计师写出来的东西,而是那些不懂电脑的文员,用各种千奇百怪的输入法手动录入的原始垃圾。「怎麽了?」
陈拙看出了楚戈的不对劲。
楚戈指着屏幕上的那堆乱码。
「对方让拿这些原始数据跑一次测试。」
楚戈头疼地揉了揉太阳穴。
「这活儿没法干,这数据太脏了,里面全是不符合任何逻辑规律的人为输入错误。」
陈拙走过去,看了一眼屏幕。
「写个正则筛除脚本不行麽?」
「不行。」
楚戈摇头。
「正则表达式只能抓取有规律的东西,你看这行,他把苹果打成了pinguo,旁边还跟了个火星文,这种东西一进底层逻辑,程序立马就会判定为异常变量,直接卡死。」
楚戈咬着牙。
「这帮孙子,自己不愿意花时间去清理这些垃圾数据,想用一千五百块钱让我连代码带清洗全包了。」旁边,陆嘉被楚戈的说话声吵醒了。
他迷迷糊糊地直起身子。
看了一眼屏幕上的那些东西。
「这没有数学规律。」
陆嘉看了一眼就得出了结论,声音带着刚睡醒的沙哑。
「代数方程解不了无序的错误。」
屋里安静
本章未完,请点击下一页继续阅读!