-
数据智能:知识图谱与文本智能处理2018年6月30日近年来深度学习异常火热,并在语音识别、图像识别、机器翻译等诸多感知智能领域取得了显著效果,但深度学习也存在对大量标注样本数据的依赖、需要大量计算资源、缺少可解释性、无法进行有效推理等问题。语言文字是人类智慧文明的载体,对语言的理解需要更高层面的认知智能。知识图谱以人类和机器皆可理解的实体、属性、关系的三元组为基本结构,以实体和概念为节点,关系为边构建一个巨大的语义网络,以此为基础进行推理计算,有助实现能推理、可解释的感知智能。本次分享首先介绍感知智能和认知智能的关系,阐述如何基于知识图谱实现认知智能,结合达观数据经验说明分享知识图谱的构建心得,最后分享达观数据文本智能处理的若干应用实践。
-
从智能到智慧:怎样设计AI迎合场景需求2018年6月30日智能这件事我们已经差不多玩到极致了,单项的人工智能已经在很多领域突破了人类的认知能力,但是为什么我们做出来的东西有几个可以拿出来说叫智慧的?为什么会出现这种情况?这背后的逻辑是不是有可以重新审视并改进的?有没有真实的商业场景来支撑?技术层面有哪些帮助智慧的理念可持续性地落地的?让我们来一起聊聊。
-
深度学习自动化和模型优化2018年6月30日深度学习是人工智能领域的一场革命。它对众多传统和新兴产业形成了深远的影响,在许多人工智能领域取得了重要的突破。然而,在实际应用过程中,深度学习模型的推行存在着诸如结构难以设计、调节超参工作复杂繁冗等许多问题。设计一套自动生成和优化的深度学习系统,可以显著提高深度学习任务的效率,降低设计门槛,并探索更优的神经网络结构。本次分享将介绍微博开发的一套深度学习中模型自动生成和优化系统的实现细节。
-
新零售场景下视觉人工智能的挑战2018年6月30日人工智能正在迅速地应用在各行各业,尤其是零售行业将迎来应用人工智能实现新零售转型的春天。线下场景的人工智能技术带来了新的技术挑战,识别调用频次高、图片采集质量容易受干扰、图片量大并且增长快。本次将逐一分享这些挑战的解决思路和方案。
-
金融科技大数据实时与多维分析应用2018年6月30日
金融科技大数据实时与多维分析应用:
1)和互联网其他领域不同,金融科技领域需要使用大数据技术主要解决两个问题:a.用户多维度信用相关数据的在线存储和访问: 单用户可能有多达上万行数据;b.用户行为/交易数据的高可用OLTP + OLAP处理:对于实时监控+运营的强需求。
2)问题a的常见解决办法:Hbase/MongoDB。问题b的可能解决趋势:MySQL -> NewSQL。
3)实时数仓 vs准实时应用vs 数仓/BI报表
-
打造深度业务价值的大数据应用2018年6月30日
具备深度价值的数据应用可划分为4个层级,每个层级都具备更进一步的价值挖掘。
提出成熟科学的数据应用建设方法论,每个层级的业务梳理内容及实现方法各有不同。
通过分享各个层级的相关案例,使企业明确具备深度价值的数据应用的形态及建设方法,真正挖掘透彻数据价值。
-
hermes分析型数据库的自研之路2018年7月1日hermes是分布式的面向分析型的数据库,在腾讯集团内部大规模应用,支撑了海量结构化和非结构化数据的全文检索、万级维度的分析业务。经过3年时间技术和方案打磨,从2017年起hermes产品化,在如金融、公安领域取得一些成功的案例。此次分享跟大家一起探讨hermes的索引特性、服务高可用架构、高吞吐量架构、高性能分析原理,分析hermes如何立足于众多的NoSQL之中。
-
大数据及云时代的数据库架构2018年7月1日随着物联网、车联网、传感器,很多企业需要面对海量数据、非结构化、复杂分析等问题,我们需要一款适合大数据库的数据库。另外云成为创业公司等默认的选择,云上具有弹性、低成本的优势怎么体现在数据库之中。本次分享主要围绕阿里云数据库团队在开源的HBase基础之上做了哪些增强,怎么支持混合负载的作业,怎么降低成本,及分享计算存储分离为什么可以实现,新硬件一般用在哪里等问题。
-
唯品会实时计算平台的演进之路2018年7月1日
唯品会现在最多使用的流计算框架还是Storm,但是核心应用已经在逐步迁移到Flink上,实时/流计算在互联网公司的业务应用中越来越占用重要的地位,技术发展也在快速迭代,计算框架层出不穷。
本次分享将展示唯品会在实时计算方向上的历程、心得和实时计算中遇到的各种挑战。在大规模使用Flink做计算引擎和使用Kubernates管理计算节点的探索经验。
-
广告系统技术实践-离线计算与实时计算2018年7月1日分享内容是业内广告系统中常用的离线计算和实时计算技术,介绍大数据在广告系统中的具体应用以及各个大数据工具组建之间的协调同步应用实践。讲解广告系统中所涉及到的hadoop,spark,hive,elasticsearch,druid等常见技术的应用规模和应用场景,如spark在系统计费环节,数据流处理环节的具体实践,hive在数据仓库中的数据分层建模,以及如何将应用维度数据导入在线查询引擎es druid,如何选定合理的数据聚合方式。然后还讲解到es druid的存储原理,行式存储和列式存储的区别。分享内容从基础使用到原理讲解,从系统架构到技术细节,从宏观概括到原理认识。
-
机器学习与推荐系统实践2018年7月1日随着数据应用的不断普及和机器学习应用的不断深入,越来越多的用户行为被各大平台收集,基于用户行为理解而构建基于机器学习算法推荐系统越来越普遍。本次演讲主要针对推荐系统中的一些基本问题在基于机器学习技术的解决方案。并结合具体推荐场景案例深入剖析机器学习应用系统在问题定义,用户理解,模型构建及应用的整体流程。
-
贝壳找房大数据平台架构实践2018年7月1日要介绍大数据平台构建优化经验,大数据量引擎的选择,以及在olap引擎的经验,以及机器学习、深度学习基础平台的一些探索经验。贝壳找房对于实时流数据处理平台秒X平台的探索经验,大数据平台构建方法大同小异,但是平台构建以后也面临很多挑战,在面临这些挑战我们如何去克服、修复它,让平台更好满足用户需求,这就是本次主题的重点。下面是本次分享的内容章节,首先讲一下架构1.0与2.0,两者分别是怎么样的,从1.0到2.0遇到了哪些问题;第二部分讲一下数据平台,都有哪些数据平台,这些数据平台都解决什么问题;第三个介绍下当前比较重要的项目“olap引擎的选型与效果”以及遇到的一些问题;第四个简单讲一下在透明压缩方面的研究。