最佳体验请使用Chrome67及以上版本、火狐、Edge、Safari浏览器 ×

创建银行
创建开票

    IDC:论DeepSeek对数据行业的影响

    编者:武花静@芯闻道 阅读87 来源: IDC 2025/02/18 01:10:54 文章 外链 公开

    DeepSeek对于科技行业的冲击是显著的,各厂商纷纷宣布接入、支持其全系列大模型,以此来获得市场和资本更多关注。数据底座作为支撑上层AI应用发展的重要部分,国内大数据厂商也在纷纷思考如何应对DeepSeek带来的客户新需求,IDC给出了相关市场观察,并绘制拥抱路径(如下图所示)以供市场参考。


    图片



    IDC观察及主要观点


    • DeepSeek短期内对不会数据市场带来明显影响,所有软件平台均集成DeepSeek后对客户选择偏好无差异化影响,且绝大部分不会对模型结构、推理流程做进一步修改。长期需要看企业对数据管理的变化,主要驱动因素包含实时性要求、多模态一致管理要求、海量数据增长挑战。

    • CoT推理过程的呈现以及可自定义调整为用户带来新的体验,对此数据服务企业可以进行的创新是做好数据映射、多模态内容关系识别、知识图谱,并结合自身行业知识经验来做好垂直行业解决方案。

    • 对于数据厂商来说,仍然存在潜在风险,DeepSeek带来的联网推理方式将使得一部分的企业文化由“以数据为中心”转向“以模型/Agent为中心”,从而进一步降低对数据管理的资金投入。

    • 无论是云厂商还是平台服务型企业,大部分不会对数据引擎和数据管理做进一步优化,更多还是依靠推理资源消耗和整体解决方案来盈利。

    • 合成数据尚缺少明确市场和需求空间,企业仍有大量未清洗数据,未来两年基于AI辅助的数据标注依然是主流。

    • 数据库敏感信息的暴露也让客户意识到安全的重要性,而可提供完整上云解决方案的云厂商、运营商成为其首选目标。


    IDC给技术供应商的建议:


    • 在提供解决方案的基础上,基于AI的订阅制收费方式也可保证数据厂商的长期现金流稳定,溢价空间在于GenAI服务的人员规模以及用户评价,排行榜单、准确率无法衡量实际业务效果且重视程度较低。

    • 率先提供完整数据服务的厂商将占有更多先机,这里的数据服务指的两个方面,一是为企业提供数据管理服务,包括数据存储、内容识别、数据统一检索,二是为AI模型训练和推理提供数据服务,这里的数据服务不仅是数据合成、数据标注,还包括坏数据识别、训练数据切分、个性化学习,面向AI的数据仿真和科学平台会得到更多关注。

    • 蒸馏、RAG部署均可能导致企业自身模型背后数据的外泄,虽从法律层面无法认定数据的所有权以及用户行为是否恶意,但依然存在极大的安全隐患,而数据服务商可以在后台建立DataOps主动观测系统,来查找潜在的风险。




    声明:本网站部分内容来源于网络,版权归原权利人所有,其观点不代表本网站立场;本网站视频或图片制作权归当前商户及其作者,涉及未经授权的制作均须标记“样稿”。如内容侵犯了您相关权利,请及时通过邮箱service@ichub.com与我们联系。
     0  0

    微信扫一扫:分享

    微信里点“+”,扫一扫二维码

    便可将本文分享至朋友圈。

      
    
    
    分享
     0
      验证