init
0
wiki/.gitkeep
Normal file
93
wiki/2022Dinky.md
Normal file
@@ -0,0 +1,93 @@
|
||||
# AllData社区与Dinky社区分享
|
||||
|
||||
### AllData社区发起人邀请Dinky的作者文末aiwenmo对AllData社区建设进行分享和宝贵建议
|
||||
### Dlink为Apache Flink而生,让Flink SQL尽享丝般顺滑,致力于实时计算平台的构建
|
||||
### Dinky项目:https://github.com/DataLinkDC/dlink
|
||||
### AllData项目:https://github.com/alldatacenter/alldata
|
||||
### 感谢社区成员@yg9538的会议纪要
|
||||
- **第一:如何激发社区对用户来参与到项目的建设,一起推动项目的发展?**
|
||||
- **第二:完成整个项目的基本功能路线,流程是如何的?**
|
||||
|
||||
**我首先回答第二个问题。首先AllData用到的技术栈包括我们所设想的整个流程是非常全面丰富的。但然,凡事都是有利有弊的,技术栈的全面会导致各个技术功能点实现复杂度增高。**
|
||||
|
||||
### 2.1 最小MVP
|
||||
|
||||
**对于第一个问题,其实跟第二个问题是非常有关系的。当我们具备了一个可使用的一个MVP最小可行性产品时候,用户将产品用在测试或者生产实践将会给项目带来极大的益处**
|
||||
**最大的好处是用户将会主动参与到我们那个项目的推动中。比如说项目的在实践中进行的测试和提出的ISSUE作为项目经验必不可少,其次用户在实际生产中遇到的二开需求,对于我们整个项目提升也是有极大的帮助。**
|
||||
|
||||
### 2.2 门户与KM知识库
|
||||
|
||||
**当然就是除了有一个最小可行性产品门户和知识库也必不可少,门户可以对整个项目进行一个详细的介绍。比如我们要进行部署的话我们可以进行搜索,百度上也会提供许多文档。但是百度的文档质量参差不齐,非常影响用户的体验。**
|
||||
|
||||
**我看到AllData有提到三个概念我是非常赞同的:**
|
||||
|
||||
- **重设计**
|
||||
- **轻编码**
|
||||
- **中度测试**
|
||||
|
||||
**对于社区来说,我们可以总结自己的经验形成文档放在社区中。**
|
||||
|
||||
### 2.3 用户分类
|
||||
|
||||
**然后第三点,因为项目前期用户是较少,在前期用户对项目的发展至关重要。这就不仅需我们仔细的聆听用户的需求,用户的反馈,还要积极的为用户来进行解答,一般用户会划分为两大类:**
|
||||
|
||||
- **有完整的技术经验——较少数**
|
||||
- **无完整的技术经验——占多数**
|
||||
|
||||
**第一种用户是自身具备一定的技术栈,一定的能力。**
|
||||
|
||||
**第二种用户是作为项目经理或技术他引入该开源项目来作为解决方案的**
|
||||
|
||||
**门户网站和知识库至关重要,它可以帮助客户进行部署。所以问题点就是如何教导用户会用我们的产品。**
|
||||
|
||||
### 2.4 工作推动
|
||||
|
||||
**然后,就是进行一个分工推这方面。如果作为一个领导者要去领导我们的协作者去完成一件事情的时候,首先要达到一个统一的共识才可以,然后如何如何来达到这个统一的共识呢**
|
||||
|
||||
#### 2.4.1 获得认可
|
||||
|
||||
**首先就得需要认可你的方案**,认可你的思路。
|
||||
|
||||
#### 2.4.2 产品定位
|
||||
|
||||
**就是说你不要让用户上生产的时候就把你所有的功能都要上去,而是可以用你几块核心功能就可以完成一个产品。**
|
||||
|
||||
### 2.5 技术选型
|
||||
|
||||
#### 2.5.1 大数据平台选型
|
||||
|
||||
基于这些平台,你可以独立完整的跑起一个MVP。这样不仅仅能享受到社区福利也可以获得用户的认可
|
||||
|
||||
#### 2.5.2 MLOPS平台选型
|
||||
|
||||
|
||||
#### 2.5.3 CI/CD
|
||||
|
||||
**CI/CD那一块我认为就比较独立了。这些也是有现成的项目,然后我们要做的其实就是调研好现成的项目。然后把它集成进来。**
|
||||
|
||||
### 2.6 需求场景
|
||||
|
||||
**我个人对AllData的定位是一个把很多开源的项目平台统一管理、集成起来,提供一个能力开放的平台**
|
||||
|
||||
#### 2.6.1 定义场景
|
||||
|
||||
**一般离线开发都是需要开发需求。**
|
||||
|
||||
### 2.7 其他要求
|
||||
|
||||
#### 2.7.1 文档要求
|
||||
|
||||
**第一,文档永远没有交流重要,文档的规范可以放松,但是交流是最主要的。**
|
||||
|
||||
#### 2.7.2 设计逻辑
|
||||
|
||||
**第二就是设计。先是高层级设计,再是具体细节设计。**
|
||||
|
||||
**这具体如何实现呢?例如我们如何去把数据开发平台、调度平台、管理平台关联?首先就需要把他们打通,作为一个底层Base先把他们真正的打通起来。然后让他们可以再以流一个流程化的方式来跑起来。**
|
||||
|
||||
**建议总结:**
|
||||
|
||||
- **压缩技术栈**
|
||||
- **理念转变为团队思想**
|
||||
- **多于其他社区沟通,达到互帮互助引流的效果**
|
||||
|
||||
25
wiki/2023AllData.md
Normal file
@@ -0,0 +1,25 @@
|
||||
# 数据中台产品
|
||||
|
||||
## 数据产品经理的方法论
|
||||
|
||||
> 数据产品经理是一个负责数据产品设计、研发和管理的职位,主要职责是通过数据挖掘、分析和可视化等技术手段,为企业提供更优质、更有价值的数据产品和服务。
|
||||
>
|
||||
> 以下是数据产品经理的方法论:
|
||||
>
|
||||
> 需求分析:通过市场研究、用户访谈和数据分析等手段,分析市场需求和用户需求,确定数据产品的功能、特性和用户需求。
|
||||
>
|
||||
> 产品设计:基于需求分析的结果,制定数据产品的设计方案,包括数据源、数据挖掘、分析和可视化等技术方案,同时考虑产品的可用性、易用性和用户体验等因素。
|
||||
>
|
||||
> 开发实施:确定数据产品的开发计划和进度,包括数据采集、清洗、分析和可视化等环节,同时考虑技术的可行性和实现难度。
|
||||
>
|
||||
> 测试验收:在产品开发完成后,进行测试和验收,确保产品的质量和可靠性,同时修复产品的缺陷和漏洞。
|
||||
>
|
||||
> 推广营销:确定产品的推广渠道和推广策略,包括线上和线下宣传、推广和营销活动,同时建立用户反馈机制,收集用户反馈和建议,以便不断改进和优化产品。
|
||||
>
|
||||
> 数据分析和监控:对数据产品的使用情况进行分析和监控,包括用户行为、产品效果、数据质量和数据安全等方面,以便及时发现问题和解决问题。
|
||||
>
|
||||
> 团队管理:作为一个数据产品经理,还需要管理和协调数据产品团队的工作,
|
||||
>
|
||||
> 包括数据工程师、数据分析师、产品设计师和开发工程师等,同时还需要与其他团队协调合作,如市场营销、销售和客户服务等部门。
|
||||
>
|
||||
> 通过以上的方法论和流程,数据产品经理可以实现对数据产品的全流程管理和优化,从而实现数据产品的高效和优质运营。
|
||||
110
wiki/2023DataFun.md
Normal file
@@ -0,0 +1,110 @@
|
||||
# AllData社区 ✖️ DataFun Meetup
|
||||
|
||||
```markdown
|
||||
AllData开源社区 ✖️ DataFun
|
||||
主要介绍AllData产品的技术及其应用场景,
|
||||
同时我们会邀请业内同行做嘉宾分享,让参与者有机会与嘉宾和其他社区成员互动。
|
||||
后续我们会继续分享AllData数字化上游生态和下游支撑平台的专题分享。
|
||||
```
|
||||
|
||||
## 01 分享嘉宾介绍
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/842b896f-e87c-4675-817e-fdd39cec0695">
|
||||
<br/>
|
||||
|
||||
## 02 AllData分享
|
||||
|
||||
#### 详情查看公众号文章:https://mp.weixin.qq.com/s/RYkcyG_9z01AWXS1ipXCRw
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/87addf2e-9515-44e2-a380-c0e08c300df6">
|
||||
<br/>
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/572d4edc-db96-45c4-a738-237306e86943">
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/c084134a-c3b0-45c7-8878-57801644f27e">
|
||||
<br/>
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/467c69e4-6a6d-426d-8f46-03adfdf97bd7">
|
||||
<br/>
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/06015020-262d-4c3d-8b59-a3f1a683c2c9">
|
||||
<br/>
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/dd9771d6-c717-45d0-9a55-19987caa93e8">
|
||||
<br/>
|
||||
|
||||
## 03 嘉宾老师分享Q&A
|
||||
|
||||
```markdown
|
||||
嘉宾老师分享Q&A
|
||||
|
||||
3.1 介绍的功能组件都开源了吗?
|
||||
|
||||
开源。详情查看社区群公告官方知识库文档。
|
||||
|
||||
3.2 哪些功能是不开源的?后续如何规划?
|
||||
|
||||
开源的功能可以用了,内部版的功能会陆续发布。详情关注github最新Release。
|
||||
|
||||
3.3 dolphin 调度有集成吗?
|
||||
|
||||
有的。我们正在学习调研相关知识内容。
|
||||
|
||||
3.4 给个详细的安装部署文档吧?
|
||||
|
||||
有的。alldata/install.md。详情查看社区群公告官方知识库文档。
|
||||
|
||||
3.5 mlops是哪个项目,提前关注一下?
|
||||
|
||||
除了cube-studio,还有另外一个,后续会发布出来。
|
||||
|
||||
3.6 和Datawork有做比较吗?
|
||||
|
||||
有的。我们积极学习Datawork开发与治理相关内容。
|
||||
|
||||
3.7 自己可以定开引入新的模块嘛,有什么好的方式?
|
||||
|
||||
可以二开引入模块。方式:基于alldata/studio/services的代码进行二次开发,然后修改相关配置。详情查看社区群公告官方知识库文档。
|
||||
|
||||
3.8 数据开发IDE工具是否有?是否会开源?
|
||||
|
||||
有的。后续会陆续发布。
|
||||
|
||||
3.9 数据开发比较常规的流程有什么内容?
|
||||
|
||||
1、数据开发(IDE),提供写sql的集成IDE平台
|
||||
|
||||
2、数据调度,将写好的SQL代码,上线进行离线,或实时调度
|
||||
|
||||
3、数据血缘,将上线的代码,对应的输入输出表,进行解析存储,展示
|
||||
|
||||
4、数据质量,对输入输出的表,进行质量判断
|
||||
|
||||
目前alldata考虑往这个方向走。
|
||||
|
||||
3.12 贡献会员有哪些优势?
|
||||
|
||||
会员权益。可以查看最新的github Release说明。详情查看社区群公告官方知识库文档。
|
||||
|
||||
3.13 未来商业版和社区版会有什么区别吗?
|
||||
|
||||
有的。内部版本也叫商业版本。详情查看查看最新的github Release说明。
|
||||
|
||||
3.14 商业版会什么时候推出?
|
||||
|
||||
推出时间为未来5-10年。
|
||||
|
||||
3.15 ide开发工具,预计何时开源?现在代码仓库有代码?
|
||||
|
||||
年底后续会发布。详情查看查看最新的github Release说明。这部分代码尚未对外发布开源。
|
||||
|
||||
3.16 怎么参与到项目开源建设中
|
||||
|
||||
开源建设。领取issue找AllData创始人确认就可以加入开发组。提交PR的规范,详情查看社区群公告官方知识库文档。
|
||||
|
||||
3.17 有没有这样功能,配置json就可以同步数据
|
||||
|
||||
有的。datax,chunjun,flinkcdc等作为可插拔的插件加入我们的数据集成方案。详情可以查看alldata/studio数据集成模块的内容。
|
||||
```
|
||||
3
wiki/2023Hudi.md
Normal file
@@ -0,0 +1,3 @@
|
||||
# Hudi性能测试报告
|
||||
|
||||
> https://docs.qq.com/doc/DVFlVUExWd3Jva2ZK
|
||||
146
wiki/2023Meetup.md
Normal file
@@ -0,0 +1,146 @@
|
||||
# AllData社区 ✖️ Datavines ✖️跑象科技Meetup
|
||||
|
||||
```markdown
|
||||
AllData开源社区 ✖️ Datavines ✖️ 跑象科技 Meetup
|
||||
主要介绍AllData产品的技术及其应用场景,
|
||||
同时我们会邀请业内同行做嘉宾分享,让参与者有机会与嘉宾和其他社区成员互动。
|
||||
后续我们会继续分享AllData数字化上游生态和下游支撑平台的专题分享。
|
||||
```
|
||||
|
||||
## 01 分享嘉宾介绍
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/ccf3deb0-fe5e-4384-bf92-a0d8b1416e5f">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/36547083-18bf-4af0-9f26-b939c1699296">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/7b89e6bb-7c46-408e-a308-50e307f0cbc8">
|
||||
<br/>
|
||||
|
||||
|
||||
|
||||
## 02 AllData分享
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/32e793dc-7d17-466f-b6aa-7aa23367484c">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/acdc09aa-d704-472e-86d5-892e5e1474ed">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/16d9add0-d772-4785-a671-3c1e9c5f4b2f">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/1bb0cc1d-8ad1-4239-acac-8b59eab1824a">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/1f98910b-a672-4ee0-a277-db68dec5161a">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/4c1b82d3-3582-4896-b0eb-b450ad74cb77">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/0afafffe-49cd-44dc-a4bd-f65296db68d8">
|
||||
<br/>
|
||||
|
||||
|
||||
|
||||
## 03 Datavines分享
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/868a41df-87c5-4fd5-a6c5-add7c2797b0f">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/70baf309-519d-42b4-a14e-cb8df7be29ee">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/23fb0238-94f6-4f7d-985d-048d6c182580">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/8243a579-4d6a-414e-94ea-4fbf6493282c">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/a951f8e8-18a5-4c1a-bc18-26c40de8e2d9">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/044cd7aa-b82c-4556-9ecc-715c28a9ed2d">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/a04eae39-f932-4dfd-8c9e-1983ee977fa6">
|
||||
<br/>
|
||||
|
||||
|
||||
|
||||
## 04 Datart分享
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/aed13016-9991-4a0a-96c5-d584e055a2e0">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/f3f8e701-68e6-420b-bc0b-cd6e676ccd08">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/19e1bc0a-ccb9-4958-a94a-bb714d0f4f5b">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/deace393-1a88-41f7-91ea-691f5c908780">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/15fcd3fc-eb5f-4df7-9755-dd195e9e2349">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/7eee3cb7-dfc3-4b7f-91a6-dad5cf901aa5">
|
||||
<br/>
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/108bd71f-412a-44ec-af46-0daf93414fa6">
|
||||
<br/>
|
||||
|
||||
|
||||
|
||||
## 05 Apache StreamPark作者分享
|
||||
|
||||
<br/>
|
||||
<img width="1215" alt="image" src="https://github.com/alldatacenter/alldata/assets/20246692/b6f6a95d-a56b-4f0f-adf7-705c23a7056b">
|
||||
<br/>
|
||||
|
||||
```markdown
|
||||
StreamPark作者王华杰给AllData社区带来了较多问题较多的分享
|
||||
|
||||
问题一:如何建设一款社区&&商业成功的开源平台
|
||||
|
||||
回答:从可用版本,到好用版本,到可规模化,真正解决客户场景的问题,让客户用在实际场景。
|
||||
|
||||
问题二:如何用一句话定义AllData
|
||||
|
||||
回答:一站式的数据中台,提供能力开放的数据中台。
|
||||
|
||||
问题三:有没有哪一块是AllData的核心优势,能在客户选型阶段必定会拿出来对比竞争的核心功能?比较拔尖出类拔萃的功能
|
||||
|
||||
回答:AllData社区目前的功能正在集成阶段,后续会出更多贯穿场景的闭环功能。
|
||||
```
|
||||
|
||||
|
||||
|
||||
|
||||
BIN
wiki/evolution/AIStudio.png
Normal file
|
After Width: | Height: | Size: 63 KiB |
BIN
wiki/evolution/Business.png
Normal file
|
After Width: | Height: | Size: 107 KiB |
BIN
wiki/evolution/BusinessProcess.png
Normal file
|
After Width: | Height: | Size: 202 KiB |
BIN
wiki/evolution/CustomScene.png
Normal file
|
After Width: | Height: | Size: 202 KiB |
BIN
wiki/evolution/Doris.png
Normal file
|
After Width: | Height: | Size: 138 KiB |
BIN
wiki/evolution/Griffin.png
Normal file
|
After Width: | Height: | Size: 301 KiB |
BIN
wiki/evolution/Overview.png
Normal file
|
After Width: | Height: | Size: 475 KiB |
BIN
wiki/evolution/Recommend.png
Normal file
|
After Width: | Height: | Size: 389 KiB |
BIN
wiki/evolution/RoadMap.png
Normal file
|
After Width: | Height: | Size: 278 KiB |
BIN
wiki/evolution/Studio.png
Normal file
|
After Width: | Height: | Size: 95 KiB |
BIN
wiki/evolution/TimeTravel.png
Normal file
|
After Width: | Height: | Size: 87 KiB |
BIN
wiki/evolution/TreeMap.png
Normal file
|
After Width: | Height: | Size: 230 KiB |