大数据融合平台

D-Fusion大数据融合平台是德拓面向各类异构数据源融合研发的一款产品，也是DANA数智平台产品重要一员，提供100+种数据源...

大数据存储管理平台

D-Vault大数据管理平台是DANA大数据平台中基础架构支撑层一个产品，提供DANA平台中所有存储引擎的统一管理视图...

大数据计算分析平台

D-Mining 大数据计算分析平台是德拓通过多个大数据项目经验积累研发出的一套可靠、安全易用的一站式大数据分析平台...

大数据可视化平台

D-Vision 是一个DANA大数据开发平台中自主研发的数据可视化系统。可对多种数据源内数据进行轻量级BI处理和可视化功能...

D-Fusion 大数据融合平台

D-Fusion大数据融合平台是德拓面向各类异构数据源融合研发的一款产品，也是DANA数智平台产品重要一员，提供100+种数据源，具有很好的易用性和稳定性。产品提供向导和脚本等方式方便可视化配置数据集成规则和处理流程，抽取任务管理、过程监控等。在数据采集、数据交换、数据同步、数据合并、数据整合、数据迁移、数据仓库建设等领域有广泛的使用。

立即试用文档 & SDK

产品概述

D-Fusion

提高可视化配置数据集成和处理

在数据采集、数据交换、数据同步、数据合并、数据整合、数据迁移、数据仓库建设等领域有广泛的使用。

任何完整的大数据平台，一般包括以下的几个过程：

● 数据采集

● 数据存储

● 数据处理

● 数据展现

数据源

丰富的数据源和转换功能支持

● 经过几年积累，D-Fusion目前已经有了比较全面的插件体系。

● 主流的RDBMS数据库、NOSQL、文件、日志、网页集成都已经接入。

性能

强劲的集成性能

● 每一种读插件都有一种或多种切分策略，都能将作业合理切分成多个Task并行执行，单机多线程执行模型可以让抽取速度随并发成线性增长。DANA团队对所有的已经接入的插件都做了极致的性能优化，并且做了完整的性能测试。

容错机制

健壮的容错机制

● 抽取作业是极易受外部因素的干扰，网络闪断、数据源不稳定等因素很容易让同步到一半的作业报错停止。因此稳定性是D-Fusion的基本要求，在D-Fusion 3.5的设计中，重点完善了框架和插件的稳定性。目前可以做到线程级别、进程级别、作业级别多层次局部/全局的重试，保证用户的作业稳定运行。

极简

极简操作体验

● D-Fusion针对常用的数据源抽取提供了向导式开发，针对复杂流程任务也支持拖拽式配置任务流程，简单清晰的表达抽取任务。

完美对接

完美对接存储和分析平台

● D-Fusion数据融合平台抽取支持非常多种类的目标数据库、文件系统，oracle, Stork, Teryx, Eagles等。

● 同时在流计算场景，通过实时消息队列，完美的和D-Mining大数据计算分析引擎对接。

产品功能

丰富的数据源和转换功能支持

产品特性

任务调度策略&监控报警

分钟级策略配置，支持复杂cron表达式。

全量&增量抽取

支持数据库/文件系统的全量抽取和增量抽取。

实时队列

兼容标准的Kafka协议。

RESTFul HTTP网关

内置RESTFul网关代理，支持给每个Kafka Topic创建独立代理,支持多节点并发。

网页爬虫

通过部署配置动态抓取相关网页信息，通过控制台轻松部署项目列表，通过设置抓取策略实时监控项目状态。

ETL Designer

支持复杂流程的ETL抽取，一键提交分布式调度框架执行。

日志收集

支持跨平台日志采集代理，自定义复杂日志采集规则，支持正则表达式,日志增量收集等特性。

支持自定义处理脚本

产品提供了丰富数据转换的功能，让数据在传输过程中可以轻松完成数据脱敏，补全，过滤等数据转换功能，另外还提供了内置公式函数，也可以让用户自定义处理脚本。

● 支持SQL脚本

● Javascript/Shell脚本

● 公式函数

支持第三方采集

● flume

● collectd

● sqoop等

应用场景

D-fusion内置实时消息引擎，兼容标准Kafka标准协议，同时支持配置HTTP/TCP 等协议代理网关，Scale-out水平扩展，高性能，满足100w+/s性能的高吞吐场景需求。

主要用于各种RDMS，Mongodb，Hbase等数据源数据同步，定时抽取、过滤加工等业务场景。

通过DANA Crab大数据融合引擎，可以帮助开发者快速进行网页爬虫系统开发。提供上手简单，灵活开放的爬虫云开发环境，让开发者只需要在线写几行Python代码就可以实现一个网站爬虫。并且爬虫将自动运行在DANA平台服务器上，爬取速度更快，效率更高。

支持Mac、linux，windows三种类型客户端，支持在客户端操作系统上按照一个代理agent，即可完成文件的定时、准实时文件收集，采集目标存储。

数智平台

了解DANA如何帮助用户实现互联网应用最大价值

产品概述

D-Fusion

提高可视化配置数据集成和处理

丰富的数据源和转换功能支持

强劲的集成性能

健壮的容错机制

极简操作体验

完美对接存储和分析平台

产品功能

任务调度策略&监控报警

全量&增量抽取

实时队列

RESTFul HTTP网关

网页爬虫

ETL Designer

日志收集

支持自定义处理脚本

支持第三方采集

应用场景

DANA 智能数据开发平台更快更高效

数智平台

了解DANA如何帮助用户实现互联网应用最大价值

产品概述

D-Fusion

提高可视化配置数据集成和处理

丰富的数据源和转换功能支持

强劲的集成性能

健壮的容错机制

极简操作体验

完美对接存储和分析平台

产品功能

任务调度策略&监控报警

全量&增量抽取

实时队列

RESTFul HTTP网关

网页爬虫

ETL Designer

日志收集

支持自定义处理脚本

支持第三方采集

应用场景

DANA 智能数据开发平台 更快 更高效

DANA 智能数据开发平台更快更高效