导读 在创建了一个帮助用户预订酒店房间或兑换忠诚度积分的应用程序后,他们需要弄清楚该应用程序的运行情况——以及它与竞争对手的对比情况。当

在创建了一个帮助用户预订酒店房间或兑换忠诚度积分的应用程序后,他们需要弄清楚该应用程序的运行情况——以及它与竞争对手的对比情况。当客户写下愤怒的在线评论说“我无法向右滚动!” 并且只给应用一颗星,开发者必须快速解决问题。

但是,根据数千条简短的在线评论来确定用户不满意的确切原因是劳动密集型、耗时且昂贵的,并且需要多个步骤。而且赌注很高。给客户带来糟糕体验的移动应用程序可能会损害公司的品牌、疏远奖励客户并增加对竞争对手的背叛。

康奈尔大学的一位统计学家和他的同事们找到了一种让开发人员更快地改进移动应用程序的方法,使用一种新的文本挖掘方法,可以一步聚合和解析客户评论。

“我们的想法是,你能不能设计一种方法来查看所有评级,并说这些是人们不满意的主题,这也许是开发人员应该关注的地方,”运营、技术和技术助理教授 Shawn Mankad 说。塞缪尔柯蒂斯约翰逊管理研究生院的信息管理。

这个想法可能对移动商务产生重大影响,预计到 2020 年将达到 2500 亿美元。根据 Mankad 和他的同事的说法,随着智能手机的日益普及,移动商务已经开始对所有形式的经济活动产生重大影响。

Mankad 是“移动应用管理在线评论的嵌入式主题建模的单阶段预测”的主要作者,该文章将出现在即将出版的《应用统计年鉴》中。Mankad 的合著者是康奈尔大学博士生胡胜利和马里兰大学的 Anandasivam Gopal。

这篇论文是 Mankad 用国家科学基金会 525,000 美元资助撰写的几篇论文之一。最初的目标是创建新的统计工具来监控金融体系的稳定性。

在最新的研究中,Mankad 和他的同事将这些工具应用于移动应用程序问题。

在文本挖掘中,一种常见的文本表示方法是构建一个巨大的矩阵来跟踪哪些词出现在哪些在线评论中。“它变成了一个非常宽的矩阵。而且你有很多列,你需要以某种方式缩小它们,”曼卡德说。“所以这就是我们应用该方法的地方。”

实际上,该模型对出现在在线评论中的词进行加权平均。这些加权平均值中的每一个都代表一个讨论主题。该方法不仅为单个应用程序的性能提供指导,而且还随着时间的推移将其与竞争应用程序进行比较,以对功能和消费者情绪进行基准测试。

“我们的想法是你接受文本,接受评级,它只输出这些你可以查看的仪表板,”曼卡德说。

他们将他们的方法应用于模拟数据和来自三个最受欢迎的在线旅行社:Expedia、Kayak 和 TripAdvisor 的 162 个版本的应用程序的 104,000 多条移动评论。每个应用程序每年有超过 1,000 条评论。

Mankad 和他的同事发现,他们的文本挖掘模型在预测真实评论和模拟数据的准确性方面比标准方法表现更好。他们发现这种方法可以帮助公司权衡他们发布新版本应用程序的频率的利弊。

“在文本挖掘中,有一类非常流行的基于贝叶斯建模的方法。该领域可以对使用什么技术变得教条化,”曼卡德说。“在这篇论文中,我们通过尝试矩阵分解方法来做一些不同的事情。对我来说,当你认为它在某些情况下可能具有优势时,尝试一种新方法是可以的。”