计算治理自动化解决方案的优势与局限性-未来发展趋势与挑战

3.计算治理自动化解决方案

- 自动参数搜索技术

- 实时监控并自适应调整

计算治理自动化解决方案的优势与局限性-未来发展趋势与挑战

4. 实际案例及成果展示

- 具体应用场景介绍

- 自动化实施流程

- 结果分析与效果展示

5. 结论与展望

- 自动化计算治理解决方案的优势与局限性

- 未来发展趋势与挑战

观众受益:

1.了解手动调优的局限性以及多参数相互作用的复杂性,认识到调优过程中实时监控和反馈的重要性。

2.通过实际案例,了解自动化解决方案在Spark任务调优中的应用和实施过程,以及取得的成果和效果。

3. 考虑自动化计算治理解决方案的优势和局限性,并了解未来趋势和挑战。

扫描二维码免费注册

③数据服务系统论坛

数据服务体系通过将底层异构物理数据(指标、标签等)语义化,结合低门槛的分析应用工具产品,实现高效、优质的数据消费,进而实现数据的价值。本次论坛将从数据服务体系建设的角度,分享数据指标中台建设方法、数据服务体系设计与实现、数据分析应用平台建设经验与案例等话题,让大家全面深入地了解大数据服务体系的建设思路。受邀专家包括字节跳动、快手、麒麟、小米、去哪儿等公司,对数据仓库、数据平台、数据应用方面的同学有很高的参考价值。

制片人:快手数据平台研发负责人董希程

个人介绍:董希程,快手数据平台研发负责人,拥有10余年大数据从业经验,《Hadoop技术内幕》作者,擅长大数据架构、数据工具链、数据中台等技术方向。

陈昌远,Volcano Engine DataWind 高级研发工程师

个人介绍:毕业于上海交通大学,本科、硕士,曾就职于百度上海研发中心,现担任字节跳动数据准备业务技术负责人,为字节跳动营销套件提供数据处理平台能力。

演讲主题:字节跳动面向各类应用场景的数据准备实践

演讲介绍:数据准备是数据分析和展现必不可少的前提,不同的数据应用场景需要不同的数据准备,本次演讲将介绍字节跳动内部针对不同应用场景的数据准备实践。

演讲提纲:

1.字节的数字应用场景

2.字节数据概述

3. 数据准备的作用

4. 数据准备的组成部分

5. 数字魔方——通过模块化组合满足各种场景

6. BI 场景,每个人都可以探索数据

7. CDP场景:突破数据孤岛,挖掘客户

8. 定制场景,获取数据,构建自己的数据应用

9. Volcano Engine 中数据准备的应用

观众受益:

1、公司级全员BI平台的数据是如何产生的?

2、在资源有限的环境下,如何保证数据的高吞吐量?

3.如何使用Volcano Engine支撑数字化转型?

陈硕快手指数平台技术总监

个人介绍:清华大学本硕毕业,曾就职于Hulu、阿里云EMR团队。2019年加入快手快手在线自助业务平台,参与了快手指标及服务平台从0到1的建设。目前专注于数据建模、指标体系、数据分析、Headless BI等技术领域的建设,有丰富的公司级指标中台建设实战经验。

演讲题目:快手统一数据服务平台设计与实践

演讲提纲:快手在大数据中台构建了统一的大数据服务平台,服务于公司所有业务,并发服务流量达千万级。本次演讲将从数据服务领域的角度介绍如何构建覆盖多场景的数据服务平台,并详细分析快手统一数据服务平台的技术架构、相关关键技术及实现实践。

观众受益:

1.数据服务体系设计思路

2.快手数据服务体系的实现

小米研发工程师 张忠良

个人介绍:主要负责小米数据服务及数据分析平台的建设。

演讲主题:基于统一语义层的智能数据分析平台

演讲提纲:介绍小米数据分析平台的技术架构、产品性能以及对小米业务的价值。

观众受益:

1.如何构建数据分析平台的架构?

2、自主研发的数据分析平台有哪些优势?

去哪儿网大数据总监 张杰

个人介绍:2015年加入去哪儿,担任大数据总监、数据平台团队负责人。目前主要负责公司级数据平台及数据治理。拥有近十年大数据从业经验,曾就职于创新工场、去哪儿,在数据仓库、数据平台、数据治理方面有丰富的实战经验,始终以数据赋能商业为目标。热爱分享,曾多次在公司内部及CSDN、QCon+、CSDI等平台以制作人或讲师的身份分享大数据相关内容。

演讲题目:去哪儿精细化运营中的CDP建设实践

演讲提纲:互联网从流量红利期进入存量期,加之全球疫情影响,精细化运营成为业务重要增长点。自2016年起,CDP(Customer Data Platform)已连续7年入选Gartner《数字营销超级周期》报告。从发展趋势来看,CDP已逐步走向成熟应用,成为精细化运营的标配工具。目前去哪儿旅行已构建上千个标签,覆盖十几条业务线,广泛应用于30多个业务场景,创造了极其可观的业务收入价值,有效发挥了CDP在数据驱动业务增长中的作用,也荣获了公司年度金奖。本次话题主要分享CDP在助力业务增长的内在逻辑和闭环构建实践,希望对CDP感兴趣的同学能有所启发。

观众受益:

1. 什么是CDP,在业务精细化运营中的作用和价值

2. CDP是提高运营效率的一站式解决方案

3. CDP在业务精细化运营中的应用场景

宗政 Kyligence 高级技术布道师

个人介绍:在Kyligence主要负责智能指标中台产品及解决方案的布道与培训工作快手在线自助业务平台,拥有丰富的技术布道、培训体系搭建及企业级培训落地经验,对行业头部客户的数据分析场景有深刻理解。

演讲主题:低代码指标平台,打造人人可用的敏捷指标工具

演讲提纲:

1. 什么是指标平台?

2. 报告驱动、数据开发效率低下的挑战

3.低代码服务重塑效率

4.低代码指标平台的突出价值

5. 从报告驱动到指标驱动

观众受益:

1、指标平台建设面临哪些挑战?

2.如何自己建立指标体系?

3、如何一键了解指标变化?

4.如何让业务用户自主使用数据?

5. 如何加速从数据到决策的过程?

扫描二维码免费注册

④ 大数据平台发展论坛

现代商业竞争已经从渠道、资源的竞争转向系统整体效率的竞争,而效率的竞争很大程度上来自于数据能力的支撑。

从数据平台的角度,我们发现演进过程中面临诸多挑战,例如:

1、数据生态非常庞大,基于资源、数据规模、时效性的权衡,不同场景会衍生出不同的架构和组件,这将带来团队碎片化、设备资源重复投入、数据一致性问题、技术选型困难、迁移风险等问题。

2、随着业务的扩展,如何平滑透明地解决可扩展性问题,用好自建和混合多云资源;如何构建一站式多租户数据工具链,平衡开发、生产、租户之间的共享与隔离;如何通过平台自治和自适应能力建设,以最低的成本提供最佳的平台服务体验;

针对上述挑战,本次论坛的嘉宾从各自的平台建设实践中带来了宝贵的经验。

主持人:腾讯数据平台部应用平台负责人 唐屯

个人介绍:唐暾,腾讯云TBDS产品创始人、腾讯云DLC研发负责人、腾讯大数据应用平台负责人,目前负责实时湖仓一体化应用架构整合及适配能力建设。

黄丹青 腾讯大数据平台大脑项目负责人

个人介绍:黄丹青,腾讯大数据平台大脑项目负责人。拥有十余年数据工程研发创新经验,专注于解决大数据领域的性能和效率问题并构建相应的平台级能力。在腾讯内部参与开发了第一个Konajdk版本(基于大数据场景特点定制),并主导了JVM诊断平台(Konaprofiler)为大数据、广告推荐、金融等场景提供广泛支持;目前负责的平台大脑项目是腾讯新一代数智融合能力的重要组成部分,通过专家经验库+AI技术双轮驱动,助力大数据平台稳定运营并降本增效,已在微信支付、广告、财付通、腾讯新闻等相关业务中落地。

演讲题目:自主在线优化新模式——腾讯大数据平台大脑AI的探索与实践

演讲提纲:近年来,大数据业务规模快速增长,给大数据平台的运营治理带来新的挑战:海量大数据任务治理缺乏统一、标准的数据和评估模型及治理工具,难以支撑业务持续优化大数据任务执行的效率和稳定性。对于数据应用开发者而言,大数据任务诊断/优化技术门槛较高,目前严重依赖人工经验,效率难以提升。腾讯大数据平台探索出数据+算法驱动的“平台自治”解决方案,逐步实现万亿级大数据分析的“自动化运行”,提供一站式大数据观测、诊断、调优能力。针对自诊断、自优化、自管理等技术难点,平台大脑通过AI辅助和自动化的平台级治理能力,大幅降低大数据产品的使用门槛。 本次分享首先介绍了超大规模数据平台运营治理领域面临的挑战和行业发展趋势,随后重点讲述了大数据平台自治体系沿着“感知-洞察-决策”链路一步步演进的过程,并阐述了腾讯大数据平台如何利用自身AI+BIGDATA双引擎探索自治在线优化新模式。

观众受益:

1.了解大数据平台稳定性与效率提升、智能自治技术及行业发展趋势与前沿实践。

2. 下一代大数据平台智能运营能力的发展趋势及可能性

余成明 思维纵横技术架构总监

个人介绍:现为四维纵横技术架构总监,拥有十余年工业大数据采集、分析处理实施经验。在天泽智云主导了iPACOM智慧风电平台的设计和交付。包括传动链、叶片等大部件的预测性维护、能量管理系统、生产管理系统、运维管理系统等;已部署近千台风力发电机终端。在三一重工,团队规模30人,主导泵松云平台1.0、2.0的数据和算法设计,平台对2万余种产品进行监控分析和管理。主要技能专注于数据系统架构和行业算法。

演讲主题:新一代车联网数据库架构——基于YMatrix的最佳实践

演讲提纲:新能源汽车行业发展迅猛,迎来万物互联的新时代。现有的数据技术诞生于互联网时代,在功能、性能、易用性等方面都无法满足海量时序数据分析场景的需求。行业需要新一代的数据库。YMatrix实现了一库多用,全面支撑新能源企业的数据管理需求,大大降低了客户使用数据库产品的门槛。只要懂SQL,就可以轻松实现大数据处理、分析、机器学习,省开发、省运维,省老板钱,省迭代时间。目前已经应用到多家新能源企业。本次分享围绕YMatrix的实际实施经验,为新能源企业数据库建设提供新思路。

观众受益:

1. 需求全景、业务全景、数据平台架构全景

2. 挑战、权衡和技术选择

3.车联网大数据平台最佳实践分享

小米高级研发工程师崔博文

个人介绍:10年研发经验,4年大数据平台研发经验。曾负责数据分析平台“XDATA”的产品研发,受到业务的广泛好评。现负责集团一站式数据开发平台“数据工厂”。

演讲题目:数据开发平台架构实践——数据开发生产环境隔离

演讲提纲:随着大数据时代的到来,数据开发平台的重要性日益凸显。数据开发平台可以提供可靠、高效、灵活的数据开发服务,为企业决策提供有力支撑。然而,数据开发平台也面临诸多挑战,其中之一就是如何在生产环境中进行数据隔离,保障数据的安全性、稳定性和可用性。本次演讲将探讨数据开发平台架构实践和生产环境隔离的重要性,以及如何通过合适的架构和技术手段解决这些问题。

观众受益:

1、为什么要隔离生产环境?

2. 隔离生产环境的挑战和困难

3. 生产环境隔离的好处和意义

赵荣生 网易云音乐数据平台开发

个人介绍:Apache Spark/Pulsar/RocketMQ Contributor,曾在腾讯、唯品会、BIGO负责数据平台及产品建设。目前主要负责云音乐的实时计算及数据平台产品建设。

演讲题目:云音乐流式与批处理统一低代码数据开发平台效率提升实践

演讲提纲:

1.云音乐数据平台现状与挑战

平台秤

·面对挑战

建设理念

2.一站式数据开发平台FastX

·设计理念

平台架构

3. 场景化实现及ClickHouse使用优化

数据产品开发场景

AB指标计算场景

索引构建场景

ClickHouse 使用优化

4. 未来计划

场景扩展

指标平台

计算与存储层批处理的统一实践

观众受益:

1.通过低代码、可视化提升数据开发效率,并以场景化方式落地,将开发周期从几天压缩到几小时

2.通过数据模型统一流式和批式场景的模型层

3.基于低代码屏蔽技术细节,降低运维成本,提高任务稳定性

胡琳 爱奇艺 高级工程师

个人介绍:胡林是爱奇艺高级工程师,目前主要负责爱奇艺数据分析平台工作。

演讲题目:爱奇艺魔镜——解决大数据分析平台问题

演讲提纲:

1.爱奇艺大数据分析平台魔镜背景介绍

2. 魔镜平台不同阶段的发展历程

3. 目前Magic Mirror平台架构、功能介绍及解决的问题

4. 魔镜平台收入

5. 未来计划

观众受益:

1.了解如何选择大数据分析平台的架构

2.了解大数据分析平台在数据中心和数据治理中的作用

茄子科技大数据技术总监 张少全

个人介绍:现为Shareit大数据技术总监。香港中文大学博士学位,研究兴趣为分布式系统设计、算法优化,研究成果发表于ICNP、SIGMETRICS、TON等会议及期刊。曾任腾讯大数据离线计算负责人,负责SuperSQL、Hive、SparkSQL、Presto等研发,是大数据开发书籍《SparkSQL内核解析》作者之一。

演讲主题:跨云大数据平台DataCake

演讲提纲:

1.跨云大数据平台DataCake简介

2. 多云混合架构下的平台管理

3. 自助式高性能数据湖分析

4. 数据计算的弹性扩展

观众受益:

1. 如何构建多云混合架构下的大数据平台

2. 如何实现自助数据湖分析

3. 如何充分利用云的弹性

扫描二维码免费注册

⑤ 前沿数据架构论坛

企业数字化转型浪潮带动了数据中台行业的蓬勃发展。作为数据中台建设中的核心要素,数据架构的好坏对项目实施后的实际效果有着重大影响。为了深入探讨数据架构的前沿理论与生产实践,帮助企业选择适合自己的数据架构,我们邀请了来自小米、OPPO、Alluxio、阿里云等技术专家,为大家带来《前沿数据架构论坛》,您将了解到现代大数据技术栈与企业数据平台架构的发展趋势、大数据计算与数据湖仓库技术的演进以及详细的应用场景。

撰稿人:付正佳,Alluxio 开源布道师

个人介绍:傅政嘉,Alluxio 开源布道者。毕业于上海交通大学电子系,后获香港中文大学信息工程博士学位。毕业后加入新加坡高级数字科学中心(伊利诺伊大学新加坡分校研究院)从事科研工作,在计算机网络、分布式系统相关顶级国际会议上发表多篇论文。加入 Alluxio 之前,傅政嘉在新加坡科技公司 Bigo Technology 担任机器学习研发总监。

张庆峰 Alluxio解决方案经理

个人介绍:张庆峰,毕业于新加坡国立大学(硕士)、西安交通大学;长期就职于Oracle、Sybase、StarNET等公司从事解决方案架构、技术咨询、产品研发等工作;在分布式缓存/分布式数据库/内存数据库、大数据/数据湖等领域拥有多年的技术架构和产品研发经验。

演讲题目:Alluxio数据编排:构建云原生大数据分析与AI计算的基石

演讲提纲:

1. 现代大数据技术栈及企业数据平台架构的发展趋势

2. Alluixo产品架构定位及典型应用场景分析

3. Alluxio全球客户案例分析

观众受益:

1.了解现代大数据栈的最新发展趋势:包括存储计算分离架构的发展、云原生技术的应用、数据湖/湖仓一体化架构的演进、企业数据平台现代化的常见场景与挑战

2.了解Alluxio产品在现代数据栈和企业数据平台中的架构定位和典型应用场景

3. 从一些全球客户案例了解Alluxio的最佳实践

阿里云高级技术专家 余奎

个人介绍:余奎,阿里云高级技术专家。哈尔滨工业大学本硕毕业后加入阿里巴巴云计算部门,从事大数据计算引擎底层研发工作近十年。

演讲题目:揭秘MaxCompute Lake-Warehouse一体化准实时增量引擎

演讲提纲:

1. 理解MaxCompute近实时数据湖访问的业务需求和痛点

2.近实时增量查询引擎设计原理介绍

3. 近实时增量数据录入应用实践

观众受益:

1、MaxCompute如何实现离线与准实时一体化设计?

2.如何基于MaxCompute支持准实时upsert增量导入业务场景

3.如何基于MaxCompute支持增量查询和时空旅行业务场景

付庆武OPPO大数据架构师

个人介绍:吉林大学计算机硕士。曾就职于去哪儿大数据团队、阿里云Maxcompute团队。现就职于OPPO数据架构组,负责大数据架构的演进与开发。

演讲题目:OPPO数据湖仓库技术演进

演讲提纲:

1、OPPO大数据架构演进

2. Shuttle2.0大数据计算辅助引擎

3.Glacier数据湖服务基础

4、湖仓非结构化领域技术探索

听众收益:了解OPPO大数据架构的演进、开源Shuttle的最新进展、大数据排序与广播方面的创新、数据湖仓库对结构化数据实时化与索引化的新技术、以及非结构化数据的技术探索。

李培典,小米研发工程师

个人介绍:毕业于北京邮电大学,参与小米流式计算引擎Flink开发,目前负责小米数据湖Iceberg开发。

演讲题目:小米数据湖冰山应用场景

演讲提纲:

1. 冰山在小米的现状

2. 小米Iceberg的应用场景

3. 未来规划

观众受益:

1. 了解 Iceberg 的实用功能

2. 了解Iceberg在小米的应用场景

扫描二维码免费注册

⑥数据仓库建模论坛

数据仓库建设是连接技术能力与业务的重要环节,数据开发人员的工作流程一般是:通过数据建模,完成数据清洗与转换,让业务快速获得标准、准确的数据。那么,数据业务建设该如何实现呢?我们需要定义统一的数据标准与规范、统一的数据保障策略、统一的数据服务能力。有了这样一套保障机制、标准流程与方法,我们才能最终对外提供高质量的数据。今天我们也邀请了各个互联网公司数据仓库建模方面的专家,为大家介绍数据建设各个环节的最佳实践。也希望通过这次线上的交流分享,能够拓宽大家对建模的思路,了解数据仓库行业近期的发展现状。

主持人:Bilibili数据平台部数据仓库平台负责人吴建雄

个人介绍:曾就职于携程、百度、哔哩哔哩等多家互联网公司,拥有十余年数据行业工作和管理经验。负责旅游、广告、视频、电商等多个领域的数据仓库0-1解决方案和技术架构设计。在数据仓库建模、数据服务、大数据引擎、性能等方面拥有丰富的经验。

邓成聪红树叶科技数字业务部CDO

个人介绍:邓成聪,2000年毕业于武汉大学,曾任职于IBM、埃森哲、百度、华为。曾任华为人工智能平台高端专家(19级),孵化华为ModelArts平台(荣获斯坦福大学和全球智博会双冠军),代表华为参与中国人工智能平台标准编制。邓成聪是TOGAF注册企业架构师(95分),曾获华为总裁奖、百度总裁特别奖。邓成聪在数据仓库/数据建模领域拥有近20年从业经验,曾供职于华为、百度、国家电网、深圳交警、十余家金融机构等机构从事数据仓库和数据建模工作。

演讲主题:Onedata数据仓库体系构建方法论

演讲提纲:

1.数据仓库和企业架构

2.数据仓库模型设计方法

3.数据仓库架构与数据分层

4.数据服务

观众受益:

1.了解企业架构与数据仓库架构的关系

2、数据仓库为什么需要建设Onedata系统?

3. 如何保障Onedata系统

胡锋,bilibili高级研发工程师

个人介绍:曾就职于招商银行、阿里巴巴,专注于大数据中台建设及数据系统化,拥有多个行业数据仓库建设经验,现就职于哔哩哔哩数据平台部数据仓库团队,负责公司级数据质量保障体系建设。

演讲主题:B站数据质量保障体系建设与实践

演讲提纲:本次分享将介绍Bilibili在数据质量保障方面的落地实践,主要内容包括:

1. Bilibili 数据质量保证的背景和目标

2. 质量保证体系架构

3.优化场景探索和案例结果

4. 未来工作展望

观众受益:

1. 数据质量到底保证什么?

2. 安保系统应包括哪些要素?

3.在大量人力投资于安全性之后,如何衡量安全的收益?

Pan Songdu,高级大数据平台开发工程师NetEase Yanxuan

个人介绍:我有毕业后的硕士学位。

语音标题:netease yanxuan中数据仓库建模平台的探索和实践

语音大纲:介绍Yanxuan的数据仓库的当前状态,分析当前的数据仓库建模过程中的问题和痛苦点,以响应痛苦点的数据仓库建模平台的设计思想和系统体系结构。平台。

受众益处:

1.企业数据仓库构建现状的定量分析

2.设计用于模型自动化构建的摘要代码生成引擎

3.如何实施和促进数据开发工作习惯和思想的转变

Li Kuibibili高级数据产品经理

个人简介:我在比利比利的数据平台部门工作。

语音主题:比利比利数据跟踪的标准化实践

语音大纲:介绍比利比利在交通数据标准化治理方面的实践经验,主要内容包括:

1.销售点交通数据标准化的背景

2.标准化策略

3.产品设计

4.审查和前景

受众益处:

1.流量数据特征和管理方法

2.如何更有效地设计流量元数据管理产品

3.实施交通管理标准化

Aitong Alibaba Cloud DataWorks产品专家

个人介绍:阿里巴巴云数据沃克人产品专家,主要负责数据建模,数据资产和数据分析以及其他产品工作。

语音主题:阿里巴巴数据模型设计和建筑实践

语音大纲:

1.阿里巴巴数据介绍需求工作流程

2.阿里巴巴电子商务建模的最佳实践

3.电子商务数据建模的实际演示

4.数据模型应用程序 - 数据资产简介

受众益处:

1.阿里巴巴数据介绍需求工作流程

2.阿里巴巴电子商务建模的最佳实践

3.电子商务数据建模的实际演示

扫描QR码免费注册

伙伴

黄金赞助商:Siwei Zongheng,合伙人:Alluxio

关于我们

数据信息:在2017年启动的大数据和人工智能技术应用程序上,它在北京,上海,上海,谢兴和Hangzhou等城市中拥有100多个脱机和100个在线沙龙,论坛和峰会,并邀请了超过2,000个专家来参与该公众更多的数据。超过16万精确的粉丝。

发表评论