No dia 17, o repórter aprendeu na Conferência de Desenvolvimento de Segurança de Dados de 2025 que meu país cultivará e expandirá várias empresas a montante e a jusante na cadeia da indústria de fatores de dados. Estima -se que, até 2030, a escala da indústria de dados do meu país atinja 7,5 trilhões de yuan.
Compartilhamento aberto de dados públicos
ativar enormes "dados de dormir"
Como o primeiro país do mundo a incluir dados em fatores de produção, meu país inicialmente construiu uma cadeia completa da indústria de dados. Os dados mostram que a produção anual de dados do meu país em 2024 atingiu 41,06 Zet Bytes, um aumento de 25%ano a ano.
A partir de agora, existem mais de 190.000 empresas relacionadas no campo de dados em meu país, e a escala da indústria de dados excede 2 trilhões de yuan. Com base na taxa de crescimento anual superior a 20%, a escala da indústria de dados do meu país atingirá 7,5 trilhões de yuan em 2030. ALT = ""/>
Diretor da Administração Nacional de Dados Liu Liehong: Atualmente, estamos planejando construir um sistema de infraestrutura de dados conectados horizontalmente conectado, conectado verticalmente e coordenado e basicamente construir a estrutura principal da infraestrutura de dados nacionais em 2029. src = "http://www.china-news-online.com/pic/2025-05-18/pudzsghxmjk.jpg" alt = "" //
O compartilhamento aberto de dados públicos se tornou uma inovação importante na mercado de elementos de dados. Em 2024, o número de plataformas abertas locais de dados públicos no nível municipal em todo o país aumentou 7,5%, o número de dados abertos aumentou 7,1%e o número de conjuntos de dados de alta qualidade aumentou 27,4%em relação ao ano anterior.
Em termos de integração de elementos e indústrias de dados, o país está acelerando as barreiras de abertura ao compartilhamento de dados públicos, promovendo a profunda integração de dados públicos e dados corporativos e ativar um enorme "dados de dormir".
Construir conjuntos de dados de alta qualidade
Acelere o desenvolvimento da inteligência artificial
Atualmente, os dados superaram os fatores de produção tradicionais e se tornaram a força motriz principal para avanços na tecnologia de inteligência artificial e na transformação industrial. Os conjuntos de dados de alta qualidade não são apenas a pedra angular do salto no desempenho do modelo de inteligência artificial, mas também reformulam toda a cadeia industrial da pesquisa e desenvolvimento tecnológicos à implementação comercial. Então, como os conjuntos de dados de alta qualidade são criados?
Em Wenzhou, Zhejiang, como um "campo de teste" para a reforma nacional orientada para o mercado dos elementos de dados, um sistema de segurança e conformidade de dados foi construído aqui para garantir o fluxo em larga escala dos elementos de dados, formar um ecossistema de negociação de dados e fazer mais dados ao vivo ".
Technical personnel told reporters that building large model data sets mainly includes core links such as data collection, data cleaning, data annotation, and quality evaluation. Cada link precisa realizar pesquisas e desenvolvimento de tecnologia direcionadas e adaptação com base nas características da diversidade em larga escala, suficientes e fortes atributos verticais da indústria.
Profession Huang tie thej, tie, Artigos, relatórios de pesquisa, foram usados. No futuro, ainda são necessárias coisas não textuais, como imagens, vídeos e vários sensores. Esses dados também são uma fonte importante de aprendizado de modelo em larga escala.
Anotação e limpeza de dados são links-chave na construção de conjuntos de dados de alta qualidade.
Anotação de dados ensina inteligência artificial a "conhecer o mundo" através da "rotulagem". Os dados não marcados são como livros didáticos ilegais, resultando em inteligência artificial incapaz de aprender efetivamente;
A limpeza de dados purifica os dados removendo duplicatas e corrigindo erros, e os dados caóticos afetarão diretamente a eficácia do treinamento de inteligência artificial.
liUl quan. Cenário e é marcado profissionalmente O modelo de IA pode romper a "precisão do laboratório", realmente tem a capacidade de implementar indústrias e impulsionar o desenvolvimento da economia digital.
The output value of my country's data labeling industry exceeds 8 billion yuan
The "2025 High-Quality Data Set Research Report" released at the 2025 Data Security Development Conference shows that with the iteration of artificial intelligence and large-scale model technology, the output value of my country's data labeling industry has exceeded 8 billion yuan, and the construction of high-quality data has entered a new stage of Desenvolvimento em larga escala e padronizado.
Em 2024, o número de empresas desenvolvendo ou aplicando inteligência artificial em meu país aumentou 36% ano a ano, e o número de conjuntos de dados de alta qualidade aumentou 27,4% em relação ao ano anterior, apoiando fortemente o treinamento e aplicação de inteligência artificial. As empresas de tecnologia de dados que usam grandes modelos e empresas de aplicativos de dados aumentaram 57,21% e 37,14% ano a ano, respectivamente.
liu atingiu centenas de bilhões de níveis. Promova a construção de sete bases de rotulagem de dados em todo o país, construa 335 conjuntos de dados de alta qualidade nos campos de assistência médica, indústria, educação etc., com uma escala total de marcação de 1,7 trilhão de TB, apoiando a pesquisa e o desenvolvimento de 121 modelos grandes domésticos.
O relatório mostra que meu país está atualmente acelerando a inovação e o desenvolvimento de conjuntos de dados de alta qualidade, mas ainda enfrenta problemas como estoques de dados pequenos e resultados baixos, qualidade desigual dos conjuntos de dados, falta de orientação de dados de alto valor de alto valor e baixa eficiência de utilização de dados.
liU quan, deputy, deputy, e "" //
liU quan, deputy " A confiabilidade e integridade das fontes de dados. Fortalecer a privacidade e a segurança dos dados e promover a construção de recursos de avaliação de segurança do conjunto de dados.
(repórteres do CCTV Wang Shiyu, Zhang Wei, Tang Zhijian, Zhang Yan, Han Dong)