外卖订单好评句子,疯狂文字外卖出餐如何通关

疯狂文字外卖出餐如何通关

《疯狂文字》外卖出餐通关攻略

外卖出餐需要根据外卖单找出合适的食物:

1、海黄金植物蛋白:将海胆和豆腐合成一起

2、风吹草地: 将牛排和羊排合成

3、窝泥酱: 先将窝窝头和土豆泥合成,再将鱼子酱合成进去

4、大地有机刺身:将胡萝卜和黄瓜合成

5、宫廷凤衣: 点击边角料区的鸡皮

6、白天不懂夜的黑: 将白米饭和黑米饭合成

外卖订单好评句子,疯狂文字外卖出餐如何通关图1

外卖订单好评句子

随着外卖平台的成熟以及物流业的快速发展,点外卖已成为大部分中国人的日常活动之一。虽然顾客与店家之间并无直接接触,但是平台的实时评论打分机制能够有力地监督店家,保障顾客权益。另一方面,这些外卖评论也为商家或平台提供了大量文本数据,如果利用得当,将是一笔宝贵的数据资源。例如,商家通过分析外卖评论,可以获取某地区用户的口味偏好、差评好评的侧重点等,以及时调整发送菜品;而平台通过大量外卖分析,也可以从宏观的角度分析不同年龄段、不同地区、不同工种民众的饮食习惯,为商业决策提供信息。

本实验中有一批外卖订单的评论,主要分为正面评论以及负面评论,本文的任务主要有二:

分析外卖订单的文本数据,挖掘有用信息。

根据数据训练一个外卖评论的自动分类器,能够将评论自动归类为正面或负面评论。

首先读取文本,熟悉数据格式。

接下来对文本数据进行一系列分析,包括所有文本及正负样本的词云图,正负样本的高频词统计分析,对数据概况进行宏观表示。

所有文本形成的词云,词汇越大,说明词频越高:

从直观上感受,外卖评论主要的关注点集中于口味、送餐速度,其次是服务态度、份量、包装、价格等,并且比较有用的关键词多是动词、形容词以及名词,当然也存在很多无意义的高频词,比如“的”、“了”。

所有正样本形成的词云:

从大体上看,正面评论主要是要表达“味道好吃”、“送餐速度快”、“感谢外卖员”、“服务态度好”这些方面。

所有负样本形成的词云:

从大体上看,负面评论主要是要表达“味道难吃”、“送餐速度慢”这俩方面。另外 ,还存在许多否定词,比如“还是”、“一点”、“不是”、“不”、“没有”。一个有趣的现象是,不管是正面还是负面评论中,“好吃”都是一个高频词,筛选负面评论中含有“好吃”的文本一探究竟。

通过一些文本的观察可知,“好吃”一般与一些否定词相搭配,形成否定的负面意思,比如“没有以前好吃”,“不好吃”,“不太好吃”,“不是特别好吃”等表达。

在有了一定的感性认识之后,接下来对词汇作一些定量分析,分别统计出正/负面评价的词频,观察两类文本中高低频词的特性,以便作更进一步的文本预处理操作。

统计正样本的词频:

统计负样本的词频:

通过以上的高低频词的打印结果,我们可以观察并分析出两个结论:

正负样本中的高频词中存在一些共同的词汇,比如“了”、“的”、“也”以及一些标点符号,因此理论上这些符号不存在区分度,可以作为停用词去除。

大部分低频词从直观上感受,与正负面情感无直接关联,因此理论上也可以把出现次数为 1 的词汇均作为停用词去除。

基于以上逻辑,我们构建一份停用词表。

接下来对数据尝试多种预处理方式,主要包括:

原文本

只保留文本中的中文

去除停用词

只保留文本中特定词性的词汇

原文本分词处理:

对于每条评论,去除非中文字符并且分词:

停用词过滤:

只保留某些词性的词汇:

所有数据如下:

在完成对数据的多种预处理之后,接下来调用机器学习集成库 scikit-learn 中的模型进行分类训练:

应用同一模型对不同处理之后的数据进行训练,看哪一种预处理方式最佳;

固定预处理数据,尝试应用多种模型,对比得到最好效果的模型。

首先,由于原始数据的标签存在固定顺序,对数据随机打乱顺序:

将文本转换为 TF-IDF 形式:

将数据切分为训练集与测试集:

模型训练并输出测试结果:

综合以上过程的主函数:

各数据统计均应用逻辑回归进行训练,作对比:

在这里,对以上结果中的评价指标作简单介绍,首先观察如下表格(称为混淆矩阵):

注意,这里的正例并非指正面评论,而负例并非指负面评论,以上表格是针对每一个类别而言。在我们的案例中,有两个类别,正面评论以及负面评论,针对每一个类别都有一个对应的混淆矩阵,因此对于每个类别,都有对应的指标。

根据预测值与真实值的不同,分类结果可分为四大情况:

TP(True positives):实际为正例且被分类器划分为正例的样本数,例如某样本真实情况为正面评论且分类器也预测其为正面评论。

FN(False positives):实际为正例但被分类器划分为负例的样本数。

FP(False negatives):实际为负例但被分类器划分为正例的样本数。

TN(True negatives):实际为负例且被分类器划分为负例的样本数。

注意,一般把 accuracy 译为准确率或正确率,precision 译为精确率或精准率或查准率,在中文中这些词汇含义容易混淆,因此最好使用英文,方便记忆。

最后来看 Micro-F1 和 Macro-F1,是针对所有类的综合考量:

Micro-F1:指上述结果中的 micro avg,先计算出所有类别总的 precision 和 recall,然后计算出的 f1 即为 Micro-F1。

Macro-F1:指上述结果中的 macro avg,计算出每一个类别的 precison 和 recall 后计算 f1,最后将 f1 平均即为 Macro-F1。

除了以上模型评价指标,实际上还有 ROC 曲线、AUC 面积等指标,那么这么多指标,到底以谁为准,如何综合判断呢?比如,我们关注评论分类器的整体判别能力,那么可以以 accuracy 或者 F1为主;希望把评论中的差评尽可能地找出来,那么需要更关注差评的 recall;希望预测为差评的样本别出错就行了,那么更关注差评的 precision。这其实取决于相关的场景以及具体的任务倾向性,不能一概而论。

由以上结果可知,只保留文本中的中文以及去除停用词结果稍好一些,在只保留某些词性的词汇时,效果反而变差,由此可见,切忌基于主观上的推理做一些盲目的文本预处理工作,预处理的有效性需要基于结果来对比证实。接下来,我们只保留文本中的中文作为训练数据,应用多种模型进行分类尝试,分别为:

支持向量机

朴素贝叶斯

GBDT

感知机

由以上结果可知,支持向量机比逻辑回归效果稍优,其它模型反而效果下降。那么,还有后续的优化空间吗?答案是肯定的。同学们可以从以下几方面入手尝试更多的优化:

数据增强

改变数据的表征形式

机器学习模型调参

深度学习模型

以上就是关于外卖订单好评句子,疯狂文字外卖出餐如何通关的全部内容,以及疯狂文字外卖出餐如何通关的相关内容,希望能够帮到您。

版权声明:本文来自用户投稿,不代表【三一手游网】立场,本平台所发表的文章、图片属于原权利人所有,因客观原因,或会存在不当使用的情况,非恶意侵犯原权利人相关权益,敬请相关权利人谅解并与我们联系(邮箱:350149276@qq.com)我们将及时处理,共同维护良好的网络创作环境。

(0)
上一篇 2023年04月09日 14:12
下一篇 2023年04月09日 14:19

相关推荐

  • 龙之谷手游龙器铭文怎么搭配 龙器铭文搭配方法推荐

    龙之谷手游龙器铭文怎么搭配 龙器铭文搭配方法推荐龙之谷手游龙器铭文给予玩家们有更多的技能使用,对于不同的龙器在铭文的选择上也有一定的不同的,下面就来看看龙之谷手游龙器铭文搭配攻略。首先每铭文需要在龙魂禁地中随机获得,也可以在公会拍卖行竞拍获得,起拍价400龙币。每一个铭文就是一条…

    2024-02-09
  • 碧蓝航线欧若拉怎么获取 获取方法介绍

    碧蓝航线欧若拉怎么获取 获取方法介绍碧蓝航线欧若拉在近期的官方爆料中正式放出,作为新版本的强力巡洋舰其获取方法以及上线时间肯定是玩家们好奇的,下面就来看看相关的介绍吧。碧蓝航线欧若拉获取途径介绍:轻型建造常驻角色碧蓝航线欧若拉建造时间:待定欧若拉游戏原型:欧若拉号轻型巡洋舰是英国…

    2024-02-09
  • 王者荣耀s9赛季新内容有什么 s9赛季新内容介绍

    王者荣耀s9赛季新内容有什么 s9赛季新内容介绍s9赛季即将到来,新赛季也是两周年庆典的当月对于赛季的新内容包括英雄皮肤等都是玩家们关心的地方,下面就来看看具体的内容介绍吧。一、新英雄s9赛季新英雄:弈星,梦见猫,离1、弈星为操作难度相对高的法师英雄。2、梦见猫为控制性坦克偏辅助…

    手机游戏 2024-02-09
  • 王者荣耀蔡文姬铭文搭配推荐 蔡文姬铭文怎么搭配

    王者荣耀蔡文姬铭文搭配推荐 蔡文姬铭文怎么搭配蔡文姬铭文的搭配对于其在游戏中对局中的发挥多少是会影响到一些的,主要体现在前中期,而对于蔡文姬铭文怎么搭配呢,下面就来看看大神的推荐吧。四级铭文:绿色奇袭 蓝色刹那 红色阳炎属性总和:最大生命+135/移速+7%/法术攻击+25/法术…

    2024-02-09
  • 王者荣耀207周年庆返场皮肤时间介绍

    王者荣耀2017周年庆返场皮肤时间介绍2017周年庆返场皮肤即将到来,对于具体的返场时间相信许多玩家们都不了解,下面就来看看具体的介绍吧。相关阅读:。王者荣耀2017周年庆限定皮肤返场活动介绍:限时返场时间:2017年10月28日零点~10月31日23:59原价返场(支持直售和赠…

    手机游戏 2024-02-09
  • 王者荣耀亚瑟心灵战警皮肤活动内容介绍

    王者荣耀亚瑟心灵战警皮肤活动内容介绍亚瑟心灵战警即将登陆正式服,在此次的新皮肤上线中也伴随了系列的活动等着大家,对于具体的内容,下面就来看看相关的介绍吧。首周折扣:1月16日更新后~1月22日折扣价格:710点券(原价888点券)拥有和分享心灵战警得回馈好礼:活动时间:1月16日…

    2024-02-09
  • 王者荣耀女娲上线时间及售价介绍

    王者荣耀女娲上线时间及售价介绍女娲将是s9赛季第二顺位上线的法师英雄,也是制作周期相对长的一个英雄,而近期由官方透露了关于女娲上线时间以及售价的具体内容,下面一起来看看吧。女娲上线时间:11月21日女娲售价:13888金币/588点卷。惊喜:首周上线8888金币/388点卷女娲皮…

    2024-02-09
  • 卧龙吟乱石副本来袭 武侯再写八阵图

    卧龙吟乱石副本来袭 武侯再写八阵图传说中,三国时期诸葛亮创设一种阵法,名为八阵图,相传诸葛孔明御敌时以乱石堆成石阵,按遁甲分成生、伤、休、杜、景、死、惊、开八门,变化万端,可挡十万精兵。作为古代战争中一种战斗队形及兵力部署图,诸葛亮的原"图"今虽不见,然有传说为诸葛亮练兵遗址的所…

    2024-02-08
  • 边境之旅镇长能不能踢人 边境之旅镇长怎么踢人

    边境之旅镇长能不能踢人 边境之旅镇长怎么踢人据官方透露,后面版本会上架市政厅系统,会有公平选举的镇长来踢人,毕竟小镇是大家共同建造的。市政厅作用:选出你小镇的镇长解锁方法:当人数及建筑解锁到一定程度即可!现在游戏刚开始阶段,处于过渡期,要稳固人流,后期应该会开放市政厅玩法。以上就…

    2024-02-08
  • 阴阳师手游与君共头像框获得方法介绍

    阴阳师手游与君共头像框获得方法介绍阴阳师与君共头像框获得方法在近期的玩家们之间展开热烈讨论中,对于具体的获得方法相信许多玩家们都不了解想,下面就来看看具体的介绍吧。阴阳师与君共头像框怎么获得?在签到奖励中,累计签到次数达到365次,即可获得“与君共”特效头像框与随机SSR。与君共…

    2024-02-08