2020南京创新周发展观察:江苏鸿程大数据“打造‘高精尖’大数据创新中心,引领数字经济发展”

大数据时代,海量数据已成为宝贵资源。2020年,中央已发文正式将数据提升为与传统生产要素同等地位的新型生产要素。以大数据与人工智能为核心的信息技术正在推动全球数字经济蓬勃发展,数字经济已成为科技革命和产业变革的核心力量,成为全球经济增长的主要驱动力。数字经济已成为未来各地经济发展竞争的主战场。据分析,目前全球22%的GDP与数字经济强相关,到2025年有望达到50%。江苏2018和2019年数字经济在GDP中的比重达到40%。

近年来,我国大数据与人工智能技术产品研发与应用发展迅速,但与主要发达国家相比仍有较大差距,存在着技术和产品原创性不足,产品和需求对接存在错位等问题。对此,南京江北新区聚焦大数据和数字经济国家战略,充分发挥地方政府在科技创新工作中的主导作用和公共资源的配置功能,依托学校学科优势领域,积极开拓渠道,引进南京大学PASA大数据实验室黄宜华教授团队,合作共建“江苏鸿程大数据技术与应用研究院”,系统开展大数据技术创新与产品和应用孵化,培育和发展完整的大数据产业和生态。

发力数字经济构建产业生态

2019年,在南京市政府、江北新区研创园、南京大学的共同支持下,“江苏鸿程大数据技术与应用研究院”落地南京江北新区。研究院依托南京大学软件新技术国家重点实验室和江苏省软件新技术与产业化协同创新中心,以南京大学PASA大数据实验室黄宜华教授团队为核心,在产学研协同的运营模式下,专业从事大数据与人工智能核心技术创新、系统平台及行业应用的研发与产业孵化,大数据与人工智能应用解决方案规划与设计,以及大数据与人工智能技术咨询与培训等服务,力争打造省内标杆性大数据新型研发机构。

“建立江苏鸿程大数据技术与应用研究院不仅能充分发挥高校、科研院所强大的科研创新能力,提升江北新区乃至南京在大数据技术的基础研究水平,还能促进科技成果的加速转化和产业化,为企业创新发展提供有力支撑。”江北新区科创局局长聂永军说。

研究院运行以来,紧扣市场对大数据处理与智能化分析应用的强劲需求,率先把科技成果转化向江北新区政府治理和产业主体延伸。

一方面,鸿程大数据研究院孵化和引进了一系列大数据与人工智能相关企业,加速构建大数据产业生态,集聚大数据专业人才、技术、资金等要素,力促大数据在政府治理、民生保障、企业生产管理等领域的应用发展。特别是,加强培育江苏省大数据高新技术企业,突出高新技术企业主体作用,着力打造集技术创新、应用与产业孵化、人才培养、以及国际合作交流为一体的产业发展基地。

另一方面,鸿程大数据研究院着力强化技术体系建设,创新推出“算法+系统+应用”与“存储+计算+分析”的两维全覆盖的大数据技术体系,持续推进在大数据分布式存储管理技术与系统产品、大数据编程计算技术与系统产品、大数据智能分析技术与产品、大数据典型行业应用等领域的研发突破,为行业大数据智能分析应用提供新技术、新产品以及整体解决方案。

自去年初成立以来,鸿程大数据研究院已经与政务以及多个行业领域开展合作。政务方面,研究院运用大数据与自然语言智能分析技术,为江苏12345在线政务服务平台完成了多项智能化分析服务开发,助力政府及时掌握民生热点需求,全面提升现代化治理能力;此外正在积极助力南京市大数据局和江北新区大数据局,开展政务大数据治理与智能化分析应用的咨询服务和示范应用探索,并正在拓展与公安行业的深度合作,开展公共安全大数据智能化技术与应用研发。在行业方面,研究院还积极开拓工业大数据技术研发,并为中石化和浦镇中车集团开展行业大数据平台建设与优化业务。除此以外,研究院还与360等互联网企业开展技术合作,并与包括360在内的15家互联网以及软件企业签订了战略合作协议。

目前,鸿程大数据研究院拥有自主研发产品5个,在研项目10个,获得软著10件,发明专利1件,累计孵化引进企业6家,实现技术合同交易额560万元。研究院还建设了大数据研发中试服务平台,拟规划建设存储和计算服务器节点包括80台服务器+40GPU,提供约900TB的分布式大规模数据存储容量。

以市场需求为引导创新平台应用

自成立以来,鸿程大数据研究院聚力“填平”科技与市场间的“鸿沟”,充分发挥大数据对传统行业转型升级的支撑作用,在江北新区助推各产业高质量发展。研究院现已开发了多个“高精尖”大数据平台产品及解决方案,正不断挖掘大数据价值,探索数字经济应用新场景。

——蓝鲸跨平台统一的可视化大数据智能分析平台,降低大数据分析编程技术门槛。随着大数据技术的快速发展,目前已出现了众多大数据分析处理和机器学习系统平台。众多的系统平台令人眼花缭乱,难以选择和学习使用。另外,综合大数据分析往往会涉及到各种不同的计算模型,例如,数据库的表模型、矩阵模型、张量模型、图模型、数据流模型等,已有的大数据系统缺少可覆盖各种计算模型、能集成使用各种不同主流大数据系统的能力。

研究院研发推出了一款跨平台统一大数据分析处理与可视化编程系统平台。该平台提供跨平台统一的大数据编程框架,并提供丰富的数据存储管理与数据处理能力,提供常用的数据统计与查询分析功能,以及机器学习、图计算、深度学习等多种编程计算与建模分析功能,这些功能以图标化算子形式内置在系统中,用户能通过拖拽方式,在无需代码编程的情况下,方便快捷地开发数据分析处理程序和算法模型。可广泛应用于政务、各类行业和企业的大数据分析建模与应用开发。

——PASA-AutoML:自动化机器学习平台,用AI赋能数据分析。机器学习与人工智能技术现已广泛应用在各个行业,然而机器学习和人工智能技术门槛较高,目前主要依赖专业人员的人力和经验。数据分析人员不仅要熟练掌握和使用各种算法模型,还要熟悉每个算法的超参数调优技巧。因此,即使是专业人员,分析建模、调参也十分费时费力。

鸿程大数据研究院开发完成了一系列创新性的AutoML自动化机器学习技术,用机器去自动化地完成人工智能模型选择和超参数调优,让AI模型设计自动化,从而大量节省人力,降低机器学习算法设计的门槛,提高建模的效率。该系列技术自主原创,国际先进,近两年来,多次参加著名人工智能与数据挖掘国际会议主办的AutoML自动化机器学习国际挑战赛,8次荣获国际大奖,并将技术转让给华为和360公司使用。

基于上述核心AutoML技术,研究院研发推出了一套自动化机器学习平台软件产品,可支持机器学习流水线自动化设计,能够自动化地构建涵盖数据预处理、特征工程、算法选择、超参调优、模型评估等多个阶段的全流程数据分析模型。通过自动化机器学习平台,可以降低AI准入门槛,使得普通的数据分析人员也能享受AI带来的红利,让AI为人人所用。

——海星交互式统一大数据编程计算平台,支持大数据系统操作便利化。大数据与数字经济正逐步成为经济增长与社会发展的新引擎,大数据技术产业落地正当其时。但是很多企业和高校用户在建设自己的大数据平台时经常遇到选型困难,安装配置门槛高,统一用户管理不便,本地开发环境较难搭建等一系列问题。

为此,鸿程大数据研究院推出海星交互式统一大数据编程计算平台。海星平台是一个轻量级、通用化、易学易用的交互式统一大数据编程计算软件平台,可支持常用大数据系统的便捷化操作,方便快速地完成行业大数据交互式分析编程,并可扩展为大数据与AI教学实践、科研实训与应用研发工具平台。平台可为用户提供独立的Python开发环境,提供HDFS、HBase、Impala、Hive等数据存储管理能力,并提供大数据计算分析统一编程接口,以及大数据文档管理、用户权限管理等功能。平台可广泛应用于高校的大数据与人工智能教学实践,以及各类企业和行业的大数据与人工智能应用开发。

此外,针对业内普遍缺乏大数据专业人才的现状,依托海星平台以及在南京大学开展大数据课程教学与学生培养的10年经验,鸿程大数据研究院同时推出了大数据教学实训平台,以“理论+实验+案例”的立体化教学方式,辅以灵活易用的实训平台,全面助力大数据人才教育事业的发展。

——海象大数据治理与数据中台软件,助力政府和行业数据治理。目前政府和行业大数据应用普遍面临着数据采集汇聚后数据质量差、缺少数据清洗治理、难以进行智能化分析应用的难题。

为此,研究院正在研发一套大数据采集汇聚和数据清洗治理技术与工具平台。该平台旨在打造集数据接入、数据管理、数据治理、质量控制、开放共享、智能分析、服务构建、行业应用为一体的数据治理与智能化分析应用数据中台,研发先进的大数据与人工智能技术,提供一流用户体验,形成数据管理与治理的理念-方法-工具平台三位一体的能力生态,提供全生命周期数据质量管理能力,在数据生命周期提供数据接入、数据清洗、数据稽核、异常数据处理、数据质量报告、数据质量标准与自动落实等数据质量管理功能,以及数据目录管理、数据脱敏与隐私保护、数据共享交换能力。

——智能化政策匹配服务系统,助力园区和企业智能化政策服务。国家、省市和科技园区,每年发布大量产业政策、科技政策、项目申请和各类扶持政策。园区和企业为了及时获取和响应这些政策,通常需要设置专人,以人工方式查看发布的大量政策,工作量大,费时费力,信息获取不及时。

为此,研究院正在研发基于自然语言文本语义分析与知识图谱的智能化政策匹配技术,并构建一套完整的基于Web的智能化政策匹配服务平台。该平台利用人工智能技术,以便捷、简单的交互方式,实现各类政策与企业进行高效智能化的匹配,既方便企业用好惠企政策,又能够助力政府管理部门及时评估政策效果。平台采用了基于知识图谱的政策图谱自动化构建技术,通过知识图谱、实体抽取、文本分类等自然语言处理算法,实现对于政策文件的自动化建模,并精准匹配各类型企业适用政策,从而能为园区和企业提供高效智能化的政策匹配服务。

企业的社会责任与担当

——疫情大数据分析预测软件平台,以社会责任为企业担当,以大数据技术助力科学精准疫情防控。自新型冠状病毒肺炎疫情暴发以来,牵动着全国亿万人民的心。特别是国内,疫情初期,舆情沸腾,各种未经证实的消息甚至谣言满天飞,很多缺乏客观理性事实的言论和猜测充斥网络,导致社会大众无所适从,并引发过度恐慌。

为了更加客观理性地分析和判断疫情的现状和发展趋势,用数据事实说话,给大众和各地政府提供客观准确的疫情信息,帮助大众了解疫情实际情况,同时也助力各地政府和园区通过数据分析预测,进行科学决策,实行科学精准化的疫情防控,同时也是出于高度的社会责任感和企业担当精神,研究院自疫情初期开始,及时组织技术团队,发挥在大数据分析技术上的优势,利用疫情大数据,每天分析预测疫情现状和发展态势,并通过研究院公众号发布疫情大数据分析报告。

在疫情初期最紧张的阶段,为了便于公众随时查询了解疫情信息,研究院在尚未能复工的情况下,进一步组织突击小组远程工作,组织团队设计开发了一款实时疫情手机查询分析软件系统,为大众、企业和政府提供实时疫情查询分析服务,及时了解全国各地及国外疫情信息。系统每天采集国家发布的官方数据和互联网数据,用数据统计分析方法,以清晰而丰富的可视化统计图呈现疫情发展状况和态势,帮助社会大众及时了解每天的疫情实际状况,观察疫情的变化,分析预测疫情的发展趋势,以此提高对疫情的认知,消除不必要的恐慌。系统发布后,受到了大众的广泛欢迎和转发使用,有力支持了防疫抗疫工作。

自1月28日起,研究院通过采集官方公布的疫情数据和互联网数据,每天进行详细的疫情数据统计分析和预测,撰写并发布了50多期国内疫情分析报告。通过大数据分析预测,我们在全国范围最早发现全国、湖北和武汉三地间疫情的很大差异,并最早呼吁实行差异化分级防控。此外,还准确预测了全国、湖北武汉疫情结束时间,为各地政府和众多企业提供了科学合理精准化防控以及及时复工的客观依据。尤其研究院发布的国内疫情分析报告,每期都提供给江北新区和研创园领导,为新区和研创园的精准防控和及时复工,提供了客观准确的决策依据,做出了较大贡献。

3月份以后,海外疫情出现暴发,为此,研究院继续定期进行海外疫情数据的采集和分析预测,定期发布分析全球疫情大数据分析报告,并提供手机查询服务。由于海外暴发疫情的国家众多,各国疫情变化差异大、变化快,因而大众难以清晰了解和比较全球各国疫情的情况。为此,研究院利用数据分析技术优势,研究构建了一个全球各国疫情指数模型,通过指数将各国疫情暴发程度以定量方式展现和排序,从而让国内外大众清晰了解各国疫情发展状况。作为国内外独创的疫情指数,发布后受到了广泛的肯定和好评。

——提出推进我省数字经济健康发展建议,推进地方数字经济发展和数字经济国家级示范区建设。数字经济已成为未来各地经济发展竞争的主战场。2018年以来,在国家数字经济战略推动下,全国诸多省市陆续出台数字经济相关发展规划与政策,推动了当地数字经济的快速增长。全国已有20多个省市陆续发布了地方数字经济发展战略规划和计划,并有30个省市正式获批建设了大数据、人工智能、数字经济国家级示范区,抢得了数字经济发展先机。江苏在数字经济发展规模上居于全国前列,但是,江苏在数字经济发展上还面临不足,包括缺少省级数字经济总体战略规划和发展规划,现有数字经济企业规模小、产业分散,缺少上规模、高水平的数字经济产业集聚区和国家级示范区。

为此,研究院负责人黄宜华,出于科技工作者对数字经济发展战略重要性的理解和企业家的社会责任,以及为推动地方高质量数字经济发展出谋划策的目的,在省科协的支持下,撰写了《关于推进江苏数字经济健康发展的对策建议》报告,提出了推动我省数字经济健康发展的对策建议,建议我省加大对数字经济的重视和推进力度,提高数字经济在全省的首位度和主导地位,尽快制定我省数字经济战略规划,充分发挥我省在实体经济领域以及科教与智慧人才方面的优势,拓展以数据和人才为关键要素的数字经济产业,推进我省上规模、高水平数字经济产业集聚区发展和国家级示范区建设。

该报告拟由省科协科技工作者建议的官方文件形式和渠道,提交给省政府领导,以期推动省领导对我省数字经济发展战略的重视,推进我省数字经济产业集聚和高水平示范区的建设,促进我省数字经济高质量健康发展。

突破体制机制壁垒,激发人才积极性

人才是支撑大数据产业发展的核心要素。运行一年多以来,鸿程大数据研究院整合政府、大学、市场三方力量,加快在引才机制、激励机制等方面的改革创新,通过打破原有体制壁垒,激发人才在创新创业中的积极性,加快创新成果产业化推进和商业化应用。

在人才队伍建设方面,针对目前市场上大数据人才薪酬待遇差距较大,普遍存在高校薪酬待遇偏低、发展前景狭窄,而企业虽待遇优厚却人才流失严重等问题,研究院首先从高校方面,积极引进本就有限的人才,在短时间内快速实现了人才聚集。同时,强化对大数据科技创新人才的培育,打造具有大数据思维和创新能力的复合型人才团队,更好促进政产学研用协同创新,加速大数据理论、技术和应用的创新。

在人才激励方面,研究院制定了多种激励机制,以提升员工对研究院的归属感和认同感,确保高端优秀人才的留存率。

一是建立高端专业人才培养和加盟创业机制。将依托研发机构在高校的国家级实验室平台和大数据专业实验室,自身培养大数据和人工智能博士和硕士高端人才,鼓励和吸引博士硕士人才,加入研究院创业。

二是建立股权激励机制。研究院将建立良好的股权激励机制,为创始团队、招聘和加盟的高端技术人才和骨干管理人才,提供良好的企业孵化和股权激励机制。同时将为后期加盟的高端人才设置合适的股权池,提供股权激励。

三是企业孵化股权激励机制。将鼓励创始团队成员和加盟的高端人才,基于自身的技术专长和研发成果,按照市新型研发机构政策所要求的企业孵化政策,从研究院直接孵化出相关企业。

四是员工晋升与绩效奖励机制。基于员工的工作绩效和工作表现、以及对公司发展的贡献度,将建立奖勤罚懒的奖惩制度;此外,在股权池中,将根据员工的绩效和贡献度,为员工设置一部分股权分配比例。

在市场运营方面,针对解决方案与行业应用规划设计以及工程实现能力与经验不足的问题,研究院一方面致力于培养和发展技术研发、产品开发、尤其是解决方案规划设计与工程实现能力,另一方面,加大力度招聘和培养具有解决方案规划设计能力和经验的工程性技术人员,做好综合性技术人才与能力储备。

在组织管理方面,针对核心骨干组织管理能力和经验不足,产品开发、项目开发队伍和组织管理不到位的情况。研究院着力建立健全良好的企业组织结构和管理机制,以专业化职业化方式推动企业运行,逐步建立健全的公司组织构架和组织管理机制,重点加强核心骨干的职业化组织管理能力培训。

“鸿程大数据研究院在加大招聘力度和人才培育的同时,建立起优胜劣汰的人员管理机制,突出发展健全的高层和中层人才队伍,调整和建立起明确的、适合公司发展的组织架构,全面激发人才能动性,促进成果更好转化”,鸿程大数据研究院负责人介绍。(沈杨子 王梦丽)

新华社民族品牌工程:服务民族企业,助力中国品牌

新华社品族品牌工程

[责任编辑:王春霞]