进入2023年,以大语言模型为代表的新AI,打开了全球对于数字生产力的全新认知,数据科学在人工智能中发挥着怎样的作用?如何借助数据科学释放数据生产力?11月19日,首届山东省数据科学大会在济南拉开帷幕,中国科学院院士彭实戈、北京大学国家特聘教授周晓华等来自全国各地的近千位专业人士,对各学科与数据科学交叉融合新范式进行了探讨。
当前,数据成为与土地、人力、资本、技术一样重要的第五大生产要素,对社会生产、生活方式、经济发展与科学研究等方面产生深远的影响。研究数据处理与应用的数据科学,在数智时代具有类似于工业时代数学和物理的基础性作用。
“数字经济已经来临,我国相继出台一系列促进大数据和产业数字化转型发展的政策,富集的数据资源是一笔财富。”省大数据局副局长顾卫东表示,数据具有乘数效应,能够创造规模经济和范围经济,提升配置效率和激励效率。充分发挥数据要素作用,是做强做优做大数字经济,赋能实体经济的必然要求。
用好数据要素,数据科学的研究是当务之急。
“海量的动态数据中,大部分是我们无法预料的,不确定性在其中起了主导作用,概率统计理论和方法对我们掌握其运动部分规律有所裨益。”中国科学院院士彭实戈教授作了题为《非线性期望与大数据》的报告。他分析,很多不同类型的普通的和高级的非线性偏微分方程在其中起到了至关重要的作用,这也提供了统计与数据科学处理非线性问题的新思路。
北京大学国家特聘教授周晓华所作的报告,探讨了精准医学中选择最佳治疗方案的因果推断方法,以及因果人工智能领域的新方法,特别是在推荐系统方面的创新,未来希望能够将因果推断运用于推荐系统AI领域研发出因果AI,实现医学应用方面新突破。
大模型的快速发展需要跨学科的合作与交流,更离不开企业的积极投入。“尽管大模型的应用前景广阔,但发展中的挑战也不容忽视,如数据隐私和安全性、算法的偏见和歧视问题以及模型的解释性和可理解性等,都需要一一攻克。”北京万方软件有限公司董事长吴广印表示。
除主论坛外,活动还设置统计与数据科学、区块链与数据要素、人工智能大模型、数据安全与隐私计算、数据合规与合规数字化、智能会计、数据产业与应用人才培养、人才管理数字化八个专题论坛,30余位专家学者作了报告。