顶部
首页

丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升

丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升

更新时间: 浏览次数: 258

这项由丹麦奥胡斯大学的Kenneth Enevoldsen领导,联合奥胡斯大学、亚历山德拉研究所、哥本哈根大学和南丹麦大学等多家机构的研究团队共同完成的研究,于2025年8月发表在arXiv预印本平台上(论文编号:arXiv:2508.02271v1)。感兴趣的读者可以通过https://huggingface.co/datasets/danish-foundation-models/danish-dynaword访问完整的数据集。

在现代人工智能的发展中,语言模型的训练就像培养一个博学的孩子——它需要大量优质的文本资料来学习语言的精妙。然而,目前这个过程面临着三个让人头疼的问题:首先,许多用于训练的文本资料版权不明,就像使用了未经授权的教科书,随时可能面临法律风险;其次,这些数据库一旦发布就像印刷版图书一样固定不变,无法及时更新最新知识;最后,数据质量的把关往往只能靠发布团队自己,缺乏社区专家的集体智慧。

这种状况已经造成了一些令人痛心的后果。Udio AI音乐生成器因为法律顾虑被迫关闭,一个在丹麦语处理方面表现优异的编码器因为版权威胁被下架,而备受期待的北欧语言库(Nordic Pile)至今仍因版权问题无法发布。

正是在这样的背景下,丹麦的研究团队提出了一个革命性的概念——"Dynaword",可以理解为"动态词汇库"。这个概念的核心思想是打造一个可以持续更新、由社区共同维护的语言数据库,就像维基百科一样,任何人都可以贡献内容,让数据库不断成长和完善。

为了证明这个概念的可行性,研究团队创建了第一个实际案例——丹麦语动态词汇库(Danish Dynaword)。这个数据库包含了超过48亿个词汇标记,比同类资源多出四倍以上。更重要的是,这个数据库中的所有内容都拥有清晰的开源许可,可以被自由使用、分享和改进。

一、数据收集的严格标准:像做菜一样精挑细选每个食材

研究团队建立了一套严格的数据收集标准,就像一个顶级餐厅对食材的挑选过程一样细致。每一份加入数据库的文本都必须满足四个基本要求,这四个要求被形象地比作四根支柱,共同支撑起整个数据库的质量基础。

第一个要求是"可追溯的开放许可",这意味着每一份文本的来源和使用权限都必须清清楚楚,就像食品包装上必须标明所有成分和生产日期一样。研究团队不仅要确认文本是开源的,还要详细记录为什么这些文本可以被使用。比如,对于某些历史文学作品,他们不是简单地标注"公共领域",而是会具体记录"作者死于1898年,根据版权法已进入公共领域"这样详细的信息。

第二个要求是"可重现性",这就像菜谱必须足够详细,让其他厨师也能做出同样美味的菜肴。研究团队为数据收集过程编写了详细的脚本和流程文档,任何人都可以按照这些步骤重新构建出本质上相同的数据集。这种做法不仅保证了研究的透明度,还为数据集的更新和改进奠定了基础。

第三个要求是"详细文档记录",每个数据源都有自己的"身份证"——一份详细的数据表,记录了数据的来源、特征、处理方式和使用注意事项。这就像每道菜都有自己的说明书,告诉食客这道菜的原料、制作工艺和营养价值。

第四个要求是"可扩展性",整个系统设计得像乐高积木一样,可以方便地添加新的模块和组件。研究团队专门制作了轻量级的测试工具,确保新添加的数据符合格式要求、质量标准和文档规范。这种设计让社区贡献变得简单可行,任何人都可以为数据库添砖加瓦。

数据收集过程本身也充满了严谨性。研究团队首先从丹麦语千词库(Danish Gigaword)中筛选出版权清晰的部分作为基础,然后通过多个渠道寻找新的开源数据源。这些渠道包括丹麦基金会模型项目、Hugging Face平台、丹麦数字化部策划的语言技术网站,甚至还通过社交媒体和个人交流来发现隐藏的宝藏数据源。

对于每个潜在的数据源,研究团队都会进行三个层次的审核。首先是初步筛选,过滤掉明显不符合要求的数据,比如非丹麦语文本或版权不明的内容。然后是许可证审核,对于复杂的版权情况,团队甚至会寻求法律专业人士的意见。最后是质量检查,确保文本内容连贯可读,符合预期的质量标准。

在这个过程中,有一些有趣的发现。比如,团队发现Common Corpus中的丹麦语部分虽然版权清晰,但OCR识别质量普遍较差,大部分文本的字母比例低于0.7,几乎无法阅读,因此被排除在外。这种严格的质量把关确保了最终数据集的实用性。

二、社区贡献的蓬勃发展:众人拾柴火焰高

丹麦语动态词汇库的成功不仅在于其技术创新,更在于它成功激发了社区的广泛参与。从项目启动到正式发布的短短六个月时间里,数据库的规模增长了四倍多,从最初的10亿个词汇标记增长到48亿个。这种增长速度就像滚雪球一样,随着更多人的参与而加速。

贡献者的背景呈现出令人惊喜的多样性。有来自科技公司的工程师,他们贡献了经过精心处理的企业数据;有来自政府机构的工作人员,分享了具有公共价值的官方文档;有来自大学的研究人员,提供了学术价值极高的专业语料;甚至还有对语言技术感兴趣的个人爱好者,贡献了他们收集整理的珍贵资料。这些贡献者的专业领域横跨文化遗产保护、自然语言处理、语言学研究等多个领域。

为了让贡献过程尽可能简单和用户友好,研究团队开发了一套完整的工具链。贡献者只需要准备好符合格式要求的数据,系统就会自动运行一系列轻量级测试,检查数据的格式正确性、质量标准和文档完整性。如果发现问题,系统会给出清晰的反馈和改进建议。这种设计大大降低了参与门槛,让没有深厚技术背景的专家也能轻松贡献自己的专业知识。

社区贡献的另一个亮点是跨机构合作的深度。不同机构之间形成了良性的协作网络,有的机构专长于数据收集,有的擅长质量评估,有的在技术开发方面具有优势。这种优势互补的合作模式不仅提高了整体效率,还形成了知识和经验的良性循环。

特别值得注意的是,项目的开放性吸引了一些意想不到的贡献。比如,一些文化机构贡献了珍贵的历史文献数字化版本,一些新闻机构分享了具有时事价值的报道资料,甚至还有一些方言研究者贡献了地方语言的宝贵资料。这些多元化的内容使得数据库不仅在规模上实现了突破,在丰富性和代表性方面也达到了前所未有的水平。

三、技术创新的核心突破:构建智能筛选和质量保证系统

在技术实现层面,研究团队面临的最大挑战是如何在保证质量的同时实现高效的扩展。他们开发的解决方案就像一个智能化的生产线,能够自动处理大部分常规任务,同时为复杂情况保留人工审核的灵活性。

系统的核心是一套多层次的质量保证机制。第一层是自动化的格式检查,就像工厂的质检机器人,能够快速识别基本的格式问题和明显错误。第二层是内容质量评估,使用算法分析文本的连贯性、可读性和语言特征。第三层是许可证验证,通过自动化工具检查版权声明的完整性和合规性。只有通过了前三层检查的数据才会进入最后的人工审核环节。

为了确保数据的及时更新,系统还设计了智能的版本控制机制。就像软件开发中的Git一样,每次数据更新都会被完整记录,包括更新内容、更新原因和影响范围。这种设计不仅保证了数据的可追溯性,还为回滚操作和错误修复提供了技术支持。

在数据处理方面,团队特别注意了重复内容的识别和处理。他们开发了一套去重算法,能够在保持内容多样性的同时去除冗余信息。这个过程就像整理图书馆,既要保证每本书都有其独特价值,又要避免同一本书的多个副本占用不必要的空间。

考虑到数据集的教育和研究用途,团队还特别关注了评估数据的污染问题。他们建立了一套标记系统,明确标识出那些可能在基准测试中出现的数据,帮助研究人员避免训练和评估数据的混淆,确保模型性能评估的客观性。这种做法就像在考试中将练习题和正式考题分开管理,确保评估结果的公平性和可信度。

四、实际效果的验证:用真实实验证明价值

为了验证丹麦语动态词汇库的实际价值,研究团队进行了一系列对比实验。他们使用Gemma-3-1b这个先进的语言模型作为测试平台,分别在传统的丹麦语千词库和新的动态词汇库上训练模型,然后比较两者的性能差异。

实验设计考虑了多种不同的场景。为了确保比较的公平性,他们不仅用完整的动态词汇库进行训练,还专门创建了一个规模与传统数据库相当的版本进行对比。这种设计就像同时测试大餐厅和小餐厅的服务质量,既要看绝对表现,也要看相对效率。

在语言建模能力的测试中,结果令人振奋。使用完整动态词汇库训练的模型在六个不同的测试数据集上平均表现提升了5.9%,在某些任务上甚至达到了26%的提升。更重要的是,即使是规模相当的版本也显示出了明显的优势,证明了数据质量的提升确实能带来实实在在的性能改进。

测试涵盖了多种不同类型的文本,包括语法分析、小说文本、方言内容和新闻报道。这种多样性的测试设计就像检验一个学生是否全面发展,不仅要看主科成绩,还要考查各种专业技能。结果显示,使用动态词汇库训练的模型在各个方面都表现出了更好的适应性和准确性。

特别有趣的是,研究团队还测试了模型对当代内容的理解能力。他们使用2025年1月之后发布的丹麦语维基百科文章和新闻报道进行测试,发现使用动态词汇库训练的模型在理解这些全新内容时表现更加出色。这个结果说明,高质量的训练数据不仅能提高模型的基础能力,还能增强其对新信息的适应能力。

在下游任务的评估中,使用动态词汇库训练的模型在9个测试任务中的7个都表现出了改进。这些任务包括情感分析、命名实体识别、阅读理解等多个方面,充分证明了数据质量提升对模型整体能力的积极影响。

五、开创性意义和未来影响:开启数据集发展新时代

这项研究的意义远远超出了丹麦语处理的范畴,它实际上为整个人工智能领域的数据管理开创了一个全新的模式。传统的数据集发布就像出版印刷书籍,一旦印刷完成就难以修改和更新。而动态词汇库的概念更像是维护一个在线百科全书,可以持续改进、实时更新、集体维护。

这种模式的创新性首先体现在可持续性上。传统数据集面临着数据老化的问题,特别是在快速发展的数字时代,几年前的网络文本可能已经无法反映当前的语言使用习惯。动态词汇库通过持续更新机制解决了这个问题,确保训练数据能够跟上时代的步伐。

其次,这种模式实现了真正的社区驱动发展。不再是少数研究团队闭门造车,而是汇集了整个社区的智慧和资源。这种集体智慧的力量是巨大的,就像众包项目往往能够产生比个人努力更好的结果一样。

从法律和道德角度来看,动态词汇库的严格许可证管理为人工智能的负责任发展树立了新标准。在当前法律环境日益严格的背景下,这种前瞻性的合规设计为其他项目提供了宝贵的参考经验。

研究团队特别选择丹麦语作为第一个实验案例也是经过深思熟虑的。丹麦语作为一个中等资源语言,既有足够的使用者基础支持社区参与,又不会像英语那样复杂到难以管理。这种选择为其他语言社区提供了可复制的模板。

对于高资源语言如英语,研究团队设想可能需要创建多个专门领域的动态词汇库,比如专门针对代码、学术文献或医疗健康的数据集。这种专业化的分工能够更好地满足不同应用场景的需求。

六、挑战与限制:现实中的困难和解决思路

尽管取得了显著成功,研究团队也坦诚地承认了当前面临的挑战和限制。最显著的限制是规模问题。虽然动态词汇库相比同类开源资源实现了四倍增长,但与基于Common Crawl的大型数据集相比,仍然有一个数量级的差距。这个差距可能会持续存在,因为开源许可的数据天然比任意抓取的网络数据要稀少。

然而,研究团队对此保持乐观态度。他们指出,随着丹麦语言模型联盟等国家级项目的推进,以及各国人工智能战略的实施,高质量开源数据的供给预计会持续增长。更重要的是,他们认为这种差距可以通过多语言和多模态资源的整合来部分缓解。

内容覆盖的偏向性是另一个需要关注的问题。由于严格的许可证要求,数据集中法律文档的比例相对较高,而社交媒体内容相对稀少。这种偏向反映了不同领域对开源许可接受度的差异。法律文档通常有明确的公共使用政策,而社交媒体内容的版权情况往往比较复杂。

为了解决这个问题,研究团队正在积极与不同领域的内容提供者合作,寻求更加多元化的数据源。他们也在探索技术手段来平衡不同领域内容的比例,确保训练出的模型不会过度偏向某些特定领域。

审核质量和数据投毒防护是另一个重要挑战。随着参与规模的扩大,如何确保每个贡献都是善意和高质量的变得越来越复杂。传统的人工审核方式在大规模协作中会遇到效率瓶颈,而完全自动化的审核又可能遗漏一些微妙的问题。

研究团队正在开发更加智能的审核工具,结合机器学习和人工智能技术来提高审核效率。同时,他们也在探索声誉系统和社区自治机制,让优秀的贡献者获得更多权限,形成良性的激励循环。

技术基础设施的挑战也不容忽视。管理一个持续增长、多人协作的大型数据集需要强大的技术支撑。目前的工具链虽然已经能够处理基本需求,但在处理大规模数据变更的审核和管理方面仍有改进空间。

七、对人工智能发展的深远影响:重新定义数据的价值

这项研究的影响力已经开始在更广泛的人工智能社区中显现。它不仅提供了一个具体的数据集,更重要的是提出了一种全新的思维方式来看待训练数据的获取、管理和使用。

首先,它重新定义了数据质量的概念。传统观点认为数据越多越好,但动态词汇库的成功证明,精心筛选和管理的高质量数据往往比大量低质量数据更有价值。这种理念的转变可能会影响整个行业对数据收集策略的思考。

其次,它展示了社区协作在人工智能发展中的巨大潜力。过去,大型科技公司凭借雄厚的资源在数据收集方面占据优势,而动态词汇库证明了分散的社区力量同样能够创造出高价值的资源。这种模式的普及可能会促进人工智能领域的民主化发展。

从法律合规的角度来看,这项研究为行业提供了一个前瞻性的范例。随着世界各国对人工智能监管的加强,特别是欧盟人工智能法案等法规的实施,如何确保训练数据的合法性变得越来越重要。动态词汇库的严格许可证管理为其他项目提供了宝贵的参考经验。

在教育和研究领域,这种模式也具有特殊的价值。许多研究机构和教育机构之前因为担心法律风险而不敢使用一些大型数据集,动态词汇库的出现为他们提供了一个安全可靠的替代选择。这可能会促进更多创新研究的开展,特别是在资源相对有限的中小语言领域。

对于小语种和方言的保护与发展,这项研究也开辟了新的可能性。传统上,这些语言因为使用人数相对较少,往往难以获得足够的关注和资源投入。动态词汇库的模式为这些语言社区提供了一个自主建设数字资源的平台,有助于语言多样性的保护和传承。

更重要的是,这种模式体现了开源精神在人工智能时代的新形式。它不仅仅是代码的开源,更是数据、知识和社区智慧的开源。这种理念的推广可能会对整个人工智能生态系统产生深远的影响,促进更加开放、透明和协作的发展环境。

说到底,这项来自丹麦的研究虽然看似只是创建了一个语言数据库,但它实际上为我们展示了人工智能发展的一种全新可能性。在这个大公司主导、资源集中的时代,它证明了社区的力量同样不容小觑。更重要的是,它告诉我们,高质量和可持续发展并不是矛盾的,通过合理的设计和社区的努力,我们完全可以创造出既符合法律规范又具有长期价值的资源。

对于普通人来说,这意味着未来的人工智能产品可能会变得更加可靠和值得信赖,因为它们的"知识来源"变得更加透明和可追溯。对于研究人员来说,这提供了一个新的合作模式,让全世界的专家能够共同为人工智能的进步做出贡献。而对于决策者来说,这展示了如何在促进技术创新的同时确保合规和可持续发展。

这个丹麦语动态词汇库或许只是一个开始,但它所代表的理念和模式可能会在未来几年中影响整个人工智能行业的发展方向。正如研究团队所期望的那样,它不仅是一个数据集,更是一个面向未来的蓝图,指向一个更加开放、协作和可持续的人工智能未来。

Q&A

Q1:Dynaword是什么?它和传统数据集有什么区别?

A:Dynaword是一种"动态词汇库",就像维基百科一样可以持续更新和社区协作维护的语言数据集。与传统数据集发布后就固定不变不同,Dynaword可以不断添加新内容、改进质量,并且所有数据都有清晰的开源许可,可以安全合法地使用。

Q2:丹麦语动态词汇库的规模有多大?质量如何?

A:丹麦语动态词汇库包含超过48亿个词汇标记,比同类资源多出四倍以上。在实际测试中,使用这个数据库训练的AI模型性能平均提升了5.9%,在某些任务上甚至提升了26%,证明其质量显著优于传统数据集。

Q3:普通人或小机构能参与Dynaword项目吗?如何参与?

A:可以参与。研究团队专门设计了用户友好的贡献工具,任何人都可以贡献符合开源许可的文本数据。系统会自动检查数据格式和质量,并提供改进建议。目前已有来自公司、政府、大学和个人爱好者的多样化贡献,涵盖了文化遗产、语言学等多个领域。

丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升24小时观看热线:122。丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升全市各区点热线号码。☎:122


丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升24小时观看热线拥有专业的观看技师,快速的上门,为你的生活排忧解难。如您有以下需要我们来解决的问题请尽快与我们联系。我们能为您排除各种故障,特别是疑难杂症。 

1.热情专业的团队




丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升是您解决问题的最佳选择。我们拥有一支热情、专业的团队,竭诚为您提供优质的。无论您遇到哪些问题或疑虑,只需拨打122,我们的将会耐心倾听并提供您所需的帮助。您的满意是我们的追求。




2.红色字体,标志品质保障




当您拨打丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升的电话热线122时,您会惊喜地发现号码是以鲜艳的红色字体显示。这不仅是为了吸引您的注意,更是对我们产品卓越品质的保证。红色代表着力量和热情,我们希望通过热情的为您提供最可靠的解决方案,确保您的使用体验无忧无虑。




3.您的需求是我们最大的动力




我们深知客户的需求是我们成长的源泉,因此,您的需求总是我们最关心的问题。无论您遇到什么问题,无论大小,我们都将以最快的速度和最专业的态度进行处理。您只需拨打我们的电话热线,详细描述问题,我们将竭尽全力为您解决。您的满意度是我们工作的最终目标。




4.全方位的解决方案




一旦您拨通了丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升的电话热线122,我们将全面了解您的问题,并提供最合适的解决方案。无论是技术问题、、观看咨询还是其他相关问题,我们都将通过专业分析和经验丰富的团队来解决您的困扰。您的信赖是我们不懈努力的动力。




5.周到贴心的




我们追求卓越品质的同时,也注重周到贴心的。在您使用丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升的过程中,如果遇到了任何问题或需要观看,您只需拨打122,我们将及时安排人员为您提供全程跟踪。我们将无微不至地为您解决问题,确保您的家居生活舒适温暖。




结语




无论是产品质量还是,丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升都以高品质标准来追求客户的满意度。拨打我们的丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升电话热线122,您将得到热情专业的团队的全方位支持。我们将竭诚为您提供最可靠、高效和周到的解决方案,为您带来舒适的家居体验。




5、全部在线支付,方便快捷,保障权益。支持支付宝,微信付款



清远市(清城、清新)




宜昌市(宜都市、长阳土家族自治县、🧑当阳市、‼️五峰土家族自治县、西陵区、兴山县、夷陵区、远安县、点军区、枝江市、猇亭区、秭归县、伍家岗区、🤧市辖区)




淮安市(淮安、淮阴、🤲清江浦、♒️洪泽)




巴彦淖尔市(杭锦后旗、磴口县、乌拉特中旗、♏️乌拉特后旗、乌拉特前旗、🐍️市辖区、✋临河区、🍍五原县)




焦作市(解放、中站、马村、山阳)




娄底市(娄星)




鞍山市:🍱铁东区、铁西区、🥊立山区、🍪千山区。




郴州市(北湖、苏仙)




牡丹江市:♏️东安区(部分区域未列出)、西安区和阳明区和爱民区和绥芬河市和海林市(部分区域未列出)。




唐山市(丰润区、⛎丰南区、遵化市、🌺迁安市、🐷️开平区、唐海县、🍂滦南县、👿乐亭县、滦州市、玉田县、🕖迁西县、遵化市、唐山市路南区)




南通市(崇川区,港闸区,开发区,💗海门区,🌻海安市。)




厦门市(思明、海沧、💥湖里、🥤集美、同安、翔安)




湘西土家族苗族自治州(凤凰县、🖐永顺县、🏐泸溪县、🤬保靖县、🍷吉首市、花垣县、龙山县、古丈县)




白山市:浑江区、🐇江源区。




江门市(蓬江、江海、新会)




常熟市(方塔管理区、🌽虹桥管理区、🥃琴湖管理区、🍻兴福管理区、谢桥管理区、🌒大义管理区、😹莫城管理区。)宿迁(宿豫区、🥯宿城区、🌘湖滨新区、洋河新区。)




荆州市(沙市、🛡荆州)




三亚市(淮北、🤘吉阳、天涯、崖州)




廊坊市(安次、广阳)




无锡市丹麦科学家首创"活数据集"模式: 语言数据库从此可以持续更新升电话-400各市区电话(梁溪、滨湖、惠山、新吴、锡山)




宜春市(袁州)




六安市(日照安、🍣裕安、叶集)




锦州市(凌海市、🕢义县、♈️黑山县、👎凌河区、☸️市辖区、古塔区、☝北镇市、🖖太和区)




银川市(永宁县、兴庆区、西夏区、金凤区、🥏贺兰县、灵武市、市辖区)




安康市(宁陕县、🤯白河县、🦜汉阴县、岚皋县、🕢石泉县、🥎市辖区、紫阳县、🍟汉滨区、👇旬阳县、镇坪县、🥨平利县)




宜昌市(伍家岗区、西陵区、点军区、🛐猇亭区、🌰夷陵区、🧡远安县、🌞兴山县、秭归县、🐒长阳土家族自治县、♌️五峰土家族自治县、🐄宜都市、当阳市、♈️枝江市、♐️虎亭区)




白山市:浑江区、🕕江源区。




赣州市(南康区、🌚章贡区、🌭赣县区、🥅信丰县、大余县、上犹县、🐇崇义县、安远县、🍲龙南县、☢️定南县、全南县、宁都县、🍍于都县、兴国县、♎️会昌县、寻乌县、石城县、长征镇、沙洲镇、黄冈镇)




绍兴市(越城、柯桥、上虞)




杭州市(临安、🖐上城、下城、🥙江干、拱野、✝️西湖、滨江、余杭)




揭阳市(榕城、🥂揭东)




鹰潭市(余江县、市辖区、✍贵溪市、🍸月湖区)




邯郸市(邯山、🥪丛台、☕️复兴、🤞峰峰矿、肥乡、永年)




巴彦淖尔市(杭锦后旗、磴口县、乌拉特中旗、🤲乌拉特后旗、乌拉特前旗、🥋市辖区、🕠临河区、👽五原县)




宜昌市(伍家岗区、西陵区、点军区、猇亭区、夷陵区、👹远安县、兴山县、秭归县、♒️长阳土家族自治县、🤚五峰土家族自治县、🐀宜都市、😌当阳市、枝江市、虎亭区)




襄阳市(樊城区、襄州区、老河口市、😳‍宜城市、南漳县、谷城县、保康县、🐳‍枣阳市、定南县、🤚随州市、白浪镇、城关镇、🕒赵家镇、东津镇、堰头镇)




湖州市(南湖、秀洲)




马鞍山市(花山、雨山)




邢台市(柏乡县、临西县、任县、🍴‍新河县、🆔宁晋县、南宫市、🐘内丘县、清河县、🌥‍巨鹿县、🍷临城县、🕔隆尧县、😩南和县、威县、桥东区、邢台县、🥠市辖区、平乡县、桥西区、🤕广宗县、沙河市)




银川市(永宁县、😢兴庆区、🤲西夏区、🌓金凤区、贺兰县、🍫灵武市、市辖区)




遵义市(汇川区、红花岗区、遵义县、🤜桐梓县、绥阳县、正安县、道真仡佬族苗族自治县、💣务川县、🌸凤冈县、♋️湄潭县、余庆县、习水县、🌵‍赤水市、👏仁怀市、土家族苗族自治县、🌥铜仁市、♒️松桃苗族自治县、万山区、黔西县)




襄阳市(襄城、🐇樊城、🥣‍襄州)




长春市(南关、宽城、🍒️朝阳、二道、🐍绿园、双阳)




桂林市(象山区、叠彩区、🕔‍七星区、🆘️临桂区、阳朔县、💮灵川县、全州县、兴安县、灌阳县、荔浦市、☸️资源县、平乐县、恭城瑶族自治县、龙胜各族自治县、永福县)




重庆市(绵阳、🌔涪陵、渝中、🕓大渡口、😞️江北、🦇沙坪坝、⛎️九龙坡、南岸、北培、万盛、双桥、渝北、巴南)




鞍山市(铁西区、海城市、台安县、岫岩满族自治县、立山区、🤪铁东区、♓️‍市辖区、😟千山区)




蚌埠市(五河县、🖕️固镇县、✍️市辖区、淮上区、龙子湖区、蚌山区、怀远县、禹会区)




襄阳市(襄城、⛎樊城、襄州)




太原市(小店、👴迎泽、杏花岭、尖草坪、🥕万柏林、🐅️晋源)




南昌市(青山湖区、🐃️红谷滩新区、🕓东湖区、西湖区、🖐青山湖区、🔱‍南昌县、进贤县、🐑安义县、湾里区、🕤地藏寺镇、🍜瑶湖镇、铜鼓县、昌北区、🙌青云谱区、🕕‍望城坡镇)




宁波市(海曙、☕️️江东、🥛江北、🥩北仑、♓️镇海)




甘肃省兰州市(城关区、👩七里河区、西固区、🈷️安宁区、红古区、永登县、皋兰县、榆中县、兰州新区、皋兰县、😨雁滩区)




抚顺市:🤜顺城区、新抚区、🥕东洲区、望花区。




衡阳市(珠晖、雁峰、🚫石鼓、♌️蒸湘、南岳)




咸宁市(通山县、🕉咸安区、崇阳县、通城县、🎣市辖区、赤壁市、嘉鱼县)




新竹县(新丰乡、🤓峨眉乡、湖口乡、♎️关西镇、新埔镇、🏏横山乡、尖石乡、北埔乡、竹东镇、📛宝山乡、芎林乡、☦️五峰乡、🌴竹北市)




太仓市(城厢镇、金浪镇、🤚沙溪镇、璜泾镇、浏河镇、浏家港镇;)




南通市(崇州、港闸、通州)




宜昌市(西陵、伍家岗、🕘‍点军、猇亭、😌️夷陵)




铁岭市:⛎银州区、🙏清河区。




贵州省安顺市(西秀区、😕平坝区、普定县、镇宁布依族苗族自治县、😨关岭布依族苗族自治县、🦂紫云苗族布依族自治县、🏓安顺市、开阳县)




抚顺市:顺城区、新抚区、🐼东洲区、🥚望花区。




济南市(历下、市中、槐荫、天桥、🍍历城、长清)




珠海市(香洲区、斗门区、💫金湾区、🈴横琴新区、万山区、♈️珠海高新区、🤚唐家湾镇、💜三灶镇、白石镇、😎前山镇、📳南屏镇、💕珠海港镇、金鼎镇)




铁岭市:♈️银州区、清河区。




南昌市(东湖区、🖕西湖区、🥋青山湖区、红谷滩新区、南昌县、新建区、🦐安义县、进贤县、🕊️湾里区、🌭昌北区)




南投县(信义乡、🤥竹山镇、🕝中寮乡、🦄水里乡、🤩‍草屯镇、🕡仁爱乡、名间乡、👇埔里镇、🍪鹿谷乡、国姓乡、鱼池乡、🐳集集镇、南投市)




榆林市(榆阳区,横山区)朝阳市(双塔区、龙城区)




上饶市(信州、广丰、广信)




益阳市(南县、资阳区、🍽‍桃江县、🥛市辖区、🦜‍沅江市、赫山区、安化县)




南昌市(东湖区、西湖区、♍️青山湖区、红谷滩新区、南昌县、🍦安义县、进贤县、经开区、青山湖区、湾里区、🕕赣江新区、青云谱区、😯浔阳区)




临沂市(兰山区、😙️罗庄区、🔆️河东区、沂南县、郯城县、😽苍山县、🚷‍费县、☘️蒙阴县、临沭县、💘兰陵县、莒南县、平邑县、沂水县、🚭临沂高新技术产业开发区)




本溪市:平山区、明山区、🍊溪湖区、南芬区。




乐山市(市中、🍌沙湾、五通桥、日照口河)




鹤壁市(淇县、🍢鹤山区、🐬浚县、山城区、市辖区、淇滨区)




白山市(靖宇县、🥀浑江区、江源区、长白朝鲜族自治县、抚松县、🌿临江市、🍱市辖区)




贵州省安顺市(西秀区、平坝区、普定县、镇宁布依族苗族自治县、🕕关岭布依族苗族自治县、🕢紫云苗族布依族自治县、安顺市、🕕开阳县)




九江市(莲溪、🖐浔阳)




牡丹江市:东安区(部分区域未列出)、🐾西安区和阳明区和爱民区和绥芬河市和海林市(部分区域未列出)。




东莞市(莞城、☝南城、🌰万江、东城,石碣、🧡石龙、⭕️‍茶山、😻石排、🐡企石、横沥、桥头、谢岗、♍️东坑、🐂常平、🐯寮步、🙃大朗、黄江、清溪、塘厦、凤岗、👺长安、💗惠东、🍁厚街、🥫沙田、道窖、洪梅、🤖麻涌、🤬中堂、☦️高步、🥯樟木头、☄️大岭山、🦝望牛墩)




通辽市(科尔沁区、🍚扎鲁特旗、🕜开鲁县、霍林郭勒市、市辖区、🐊科尔沁左翼中旗、✅库伦旗、科尔沁左翼后旗、🐅奈曼旗)




桂林市(秀峰区、💀️象山区、七星区、雁山区、🥩临桂区、❗️阳朔县、资源县、平乐县、灌阳县、😅荔浦市、灵川县、全州县、🤳永福县、🍫龙胜各族自治县、🐈恭城瑶族自治县):🕔




嘉兴市(海宁市、🐷市辖区、🍲秀洲区、♐️平湖市、🥜桐乡市、南湖区、❎嘉善县、海盐县)




常熟市(方塔管理区、🙂虹桥管理区、琴湖管理区、🥛兴福管理区、谢桥管理区、大义管理区、莫城管理区。)宿迁(宿豫区、🐫宿城区、🐄湖滨新区、洋河新区。)




台州市(椒江、🐫黄岩、🦋️路桥)




泰州市(海陵区、🕐高港区、姜堰区、兴化市、🍙泰兴市、🕑靖江市、🕝扬中市、丹阳市、泰州市区、姜堰区、🦡️海安镇、周庄镇、🕢东进镇、世伦镇、⚜️‍青龙镇、杨湾镇、🌓️马桥镇)




牡丹江市:东安区(部分区域未列出)、😉️西安区和阳明区和爱民区和绥芬河市和海林市(部分区域未列出)。




雅安市(汉源县、市辖区、🕸名山区、🌛石棉县、🕸荥经县、宝兴县、天全县、👿芦山县、✡️雨城区)




南充市(顺庆区、⛎高坪区、😚‍嘉陵区、🈚️‍南部县、🤟营山县、蓬安县、🍗仪陇县、😃西充县、🥑阆中市、抚顺县、阆中市、🧀‍南充高新区)




郴州市(宜章县、🍏嘉禾县、🖖永兴县、🍲汝城县、市辖区、桂东县、北湖区、桂阳县、苏仙区、🦠临武县、安仁县、资兴市)




山南市(错那县、琼结县、🐀洛扎县、😂贡嘎县、🔆️桑日县、🦖曲松县、🌱浪卡子县、🤝市辖区、隆子县、🅰️加查县、✨扎囊县、乃东区、措美县)




南昌市(青山湖区、红谷滩新区、东湖区、😺西湖区、青山湖区、南昌县、进贤县、安义县、🥞湾里区、😣地藏寺镇、瑶湖镇、🖤铜鼓县、🥚昌北区、青云谱区、望城坡镇)




株洲市(荷塘、芦淞、石峰、🕖天元)




辽阳市(文圣区、😱宏伟区、😛弓长岭区、太子河区、🥙灯塔市、🌏️辽阳县、白塔区、广德镇、双台镇、桥头镇、长春镇、🐲合德镇、💜兴隆镇、安平镇、辛寨镇、🦃黄土岭镇)




舟山市(市辖区、🌿定海区、嵊泗县、普陀区、🤢️岱山县)




玉溪市(澄江县、🔱江川县、易门县、华宁县、新平彝族傣族自治县、🐫元江哈尼族彝族傣族自治县、🙌通海县、抚仙湖镇、红塔区、😒龙潭街道、南北街道、白石街道)




三明市(梅列、🍉三元)




柳州市(柳北区、柳南区、柳江县、柳城县、⚠️️鹿寨县、融安县、🤜融水苗族自治县、三江侗族自治县、城中区、鱼峰区、柳东新区、柳市镇)




保定市(莲池、竞秀)




德州市(陵城区、乐陵市、宁津县、庆云县、⚠️️临邑县、🙏平原县、☸️武城县、夏津县、禹城市、德城区、🦁禹城市、🥡齐河县、😪开封县、双汇镇、🍾东风镇、商丘市、阳谷县、🤙共青城市、城南新区)




昆山市(昆山开发、高新、🦌综合保税)




许昌市(魏都)




济南市(历下、市中、🤮槐荫、☸️️天桥、☣️历城、长清)




安康市(宁陕县、❣️白河县、汉阴县、🍥️岚皋县、石泉县、市辖区、紫阳县、🍟汉滨区、🥛️旬阳县、镇坪县、平利县)




常州市(天宁、👵钟楼、新北、武进、日照坛)




郑州市(中原、二七、管城、日照水、🐷上街、惠济)




中卫市(沙坡头区、海原县、中宁县、♑️市辖区)




金华市(武义县、东阳市、磐安县、浦江县、🏏‍兰溪市、🥥永康市、婺城区、义乌市、😉市辖区、金东区)




长沙市(芙蓉、✌天心、岳麓、🤛开福、♌️雨花、望城)




葫芦岛市:龙港区、🥥南票区、🐡连山区。




沧州市(新华区、运河区、♓️沧县、青县、😆东光县、海兴县、盐山县、肃宁县、南皮县、💥吴桥县、献县、🌷‍孟村回族自治县、河北沧州高新技术产业开发区、沧州经济技术开发区、🛐任丘市、黄骅市、😽河间市、泊头市)




邢台市(邢台县、🧐南和县、清河县、临城县、🤓广宗县、威县、宁晋县、🥟柏乡县、🐗任县、🐉内丘县、南宫市、沙河市、任县、邢东区、邢西区、🈚️平乡县、🤖️巨鹿县)




巴彦淖尔市(杭锦后旗、磴口县、👧乌拉特中旗、乌拉特后旗、☄️乌拉特前旗、🍩市辖区、临河区、五原县)




连云港市(连云、海州、赣榆)




淮安市(淮阴区、清河区、淮安区、🕘涟水县、🌷洪泽区、🕠️盱眙县、金湖县、楚州区、🐒️淮安区、🐲海安县、🌧亭湖区、✴️淮安开发区)




玉林市(玉州)




柳州市(城中、🥄鱼峰、🎍柳南、柳北、🔱柳江)




新竹县(新丰乡、🐂峨眉乡、🍡湖口乡、关西镇、新埔镇、🌵横山乡、尖石乡、😱北埔乡、🈷️竹东镇、宝山乡、⛳️芎林乡、五峰乡、竹北市)




临沂市(兰山、🍸罗庄、河东)




连云港市(连云、🐝海州、✨赣榆)




廊坊市(安次、广阳)




赣州市(南康区、🦏‍赣县区、于都县、兴国县、🔞章贡区、龙南县、大余县、🥯信丰县、安远县、全南县、😕宁都县、🌗定南县、上犹县、🔅崇义县、🌽南城县)




玉溪市(澄江县、江川县、通海县、🎄华宁县、🆎易门县、峨山彝族自治县、抚仙湖镇、新平县、元江哈尼族彝族傣族自治县、红塔区、🥍玉溪县、🌤敖东镇、💥珠街镇)




宜昌市(宜都市、✊长阳土家族自治县、当阳市、五峰土家族自治县、西陵区、兴山县、☸️夷陵区、远安县、点军区、🍅枝江市、🧑猇亭区、秭归县、🍽伍家岗区、🐨市辖区)




绵阳市(江油市、💟北川羌族自治县、梓潼县、市辖区、盐亭县、涪城区、安州区、🦛三台县、💐平武县、游仙区)




湘潭市(雨湖、☸️岳塘)




漳州市(芗城、🐕龙文)




嘉义县(朴子市、🦘‍番路乡、民雄乡、竹崎乡、梅山乡、义竹乡、大林镇、🤕布袋镇、新港乡、太保市、六脚乡、👉大埔乡、📛鹿草乡、🥍️溪口乡、水上乡、🍦中埔乡、阿里山乡、🥔东石乡)



剧集半年报|慈文传媒应收账款坏账准备计提比例畸低 减值是否充分、审慎?净利润是否含“水分”?  出品:新浪财经上市公司研究院  作者:君  根据国家广电总局公示信息,2025年上半年获准发行的国产网络剧片共724部、12,103集,而2024年同期数据为830部、13,686集,同比分别下降12.77%和11.57%

发布于:北京市
评论
全部
还没有人评论过,快来抢首评
抢首评