图计算3大挑战
据周靖人介绍,图计算是阿里关注的重要技术之一,可以将电商平台、用户产品、支付宝账户等大量信息作为节点来建模处理,基于此可以产生很丰富的分析场景,当前图计算已经在阿里搜索推荐、反作弊、知识图谱等领域大规模应用。
靖人指出,由于实体模型中,存在许多关系以及数十亿的结点和边,并且以很快的速度动态更新,实时并发更新图数据的同时进行复杂的图分析是留给工业界和学术界的课题。具体来说存在3个方向的挑战。
挑战1:图可视化,即如何有效地将图背后的特征和信息展现出来,更好地与人交互,辅助推理、分析和决策。
挑战2:模式匹配,根据业务的特征,在复杂关系网络中定义并识别核心模式,并在大规模图中实现快速匹配。常用的场景有反欺诈、风险控制和ID映射等等。
挑战3:处理快速变化的图,也就是当图节点和边动态更新下的图计算问题。
此外,如何将图计算和机器学习结合,利用人的在线行为模式来进一步提高推荐、搜索等效果,也是阿里技术人员正在解决的难题。
周靖人认为,阿里机器学习的优势来源于对亿万数据样本和特征的高效利用,阿里的服务器架构就是为了处理如此庞大的模型和数以亿计的参数而开发的。“目前阿里大规模机器学习平台,可以统一支持深度学习模型训练以及模型更新,此外我们也建设了CPU、GPU、FPGA异构计算平台,可以针对不同业务特点做机器学习的计算优化”。
据知情人士透露,阿里正在和知名高校在图计算和大规模机器学习领域搭建合作平台,希望和学界一起推动这些领域研究的快速发展。外界分析,这也是阿里此前公布的“NASA”计划中的重要技术布局之一。
这个怎么看?
据周靖人介绍,图计算是阿里关注的重要技术之一,可以将电商平台、用户产品、支付宝账户等大量信息作为节点来建模处理,基于此可以产生很丰富的分析场景,当前图计算已经在阿里搜索推荐、反作弊、知识图谱等领域大规模应用。
靖人指出,由于实体模型中,存在许多关系以及数十亿的结点和边,并且以很快的速度动态更新,实时并发更新图数据的同时进行复杂的图分析是留给工业界和学术界的课题。具体来说存在3个方向的挑战。
挑战1:图可视化,即如何有效地将图背后的特征和信息展现出来,更好地与人交互,辅助推理、分析和决策。
挑战2:模式匹配,根据业务的特征,在复杂关系网络中定义并识别核心模式,并在大规模图中实现快速匹配。常用的场景有反欺诈、风险控制和ID映射等等。
挑战3:处理快速变化的图,也就是当图节点和边动态更新下的图计算问题。
此外,如何将图计算和机器学习结合,利用人的在线行为模式来进一步提高推荐、搜索等效果,也是阿里技术人员正在解决的难题。
周靖人认为,阿里机器学习的优势来源于对亿万数据样本和特征的高效利用,阿里的服务器架构就是为了处理如此庞大的模型和数以亿计的参数而开发的。“目前阿里大规模机器学习平台,可以统一支持深度学习模型训练以及模型更新,此外我们也建设了CPU、GPU、FPGA异构计算平台,可以针对不同业务特点做机器学习的计算优化”。
据知情人士透露,阿里正在和知名高校在图计算和大规模机器学习领域搭建合作平台,希望和学界一起推动这些领域研究的快速发展。外界分析,这也是阿里此前公布的“NASA”计划中的重要技术布局之一。



