首页 > 雷火竞技官网入口 > 自有产品

应用文本大数据提升环境治理能力

发布时间:2022-08-20 01:06:39 来源:雷火竞技 作者:雷火竞技官网入口
点击次数: 5

  近年来,随着互联网、计算机的飞速发展和技术进步以及人工智能软硬件技术的发展和广泛应用,数据作为记录各种人类活动的一种重要资源而呈现出爆发式增长,而从海量的、非结构化的数据中获取、处理、分析、挖掘其中有价值的信息成为国内外政府、企业以及学术界的关注焦点。2015年国务院印发《促进大数据发展行动纲要》,首次从国家信息化发展的战略层面认定数据是国家的基础性战略资源,大数据成为提升政府治理能力的新途径。2016年生态环境部(原环境保护部)印发《生态环境大数据建设总体方案》,开启“互联网+生态环境”战略,推动政府环境治理创新。

  因此,大数据逐步成为环境治理的重要战略资源和政府提升环境治理能力的重要手段,发展数字经济也成为可持续发展的重要方向,同时,对于推动生态环境治理能力现代化和加快生态文明建设进程具有重要意义。其中,非结构化的文本大数据作为一种新的数据源,也是最重要的信息载体之一,往往带有明显的领域特征和独特的语言模式,也常常包含大量的专业词汇,能够为环境治理问题提供有效的信息和独特的分析视角。例如,文本大数据可以用于测度环境政策的不确定性、量化媒体关注度以及舆论导向、不同环境治理主体的情绪对相应问题解决方式的影响、基于新闻的隐含波动因素等。

  传统的数据收集往往借助于纸质媒介,体量较小,数据获取成本高,获取时间相对滞后;而通过互联网媒介进行文本数据收集和处理,不仅成本大幅降低,数据的可得性大幅增加,数据的体量也呈现几何级数增长的特征。同时,随着网络平台发布信息普及度的提高,除了传统的政府职能部门和相关机构发布信息之外,微博、微信公众号、朋友圈、论坛帖子等新媒体形式也逐渐成为数据来源的重要渠道,文本大数据的发布主体从单一向多样化进行转变,频率变得更高。通过互联网平台积累起来的数据,就存储在网络空间中,文本信息即刻在网络中留下痕迹,通过一定的方法和技术进行提取,信息获取更加及时,数据获取的成本也相对降低。通过利用互联网大数据信息,可以获取接近全体的样本信息,海量的样本量支持下,避免了由于信息不全面导致的错觉以及判断失误,未来还将开拓更为丰富的数据源,如政府工作报告、规划、书籍、档案等。

  文本数据是信息的抽象提炼,正是由于海量文本数据信息的存在,获取、处理和分析文本大数据方面仍然存在一些问题,其中最重要的是如何准确并且有效率地从海量文本中提取出所需要的核心信息,并考察其对相应问题的解释或预测能力。提取文本数据信息需要综合考虑文本数据的来源、语言环境、内容长短、句式结构以及需提取信息的特征等因素,同时也要考虑信息提取的成本和收益。在条件允许的情况下,可以采用相对复杂的统计学习和深度学习相结合的信息提取方法来提高信息提取的准确性,优化人机合作成为解决困难的重要方式。使用复杂方法时还需要保证这些方法的透明性和可复制性。最后还要注意的是,数据的结构化转换和文本数据信息提取这两步的执行顺序需要依靠具体问题来决定,有时需要经过多次尝试才能找到最佳方案。

  现有环境领域文本相关分析的问题主要有两大类,一是区分文本显示的公民的情绪正负、新闻或者文件语调正负等聚类问题,二是对情绪、不确定性、恐慌程度、意见分歧程度的度量以及相应的回归问题。

  因为情绪的变化可能会导致问题处理的结果不同,度量情绪并预测风险是文本大数据在环境治理领域的重要应用方向,典型的例子是邻避效应。通常用“语调”来表示“情绪”,语调的不同表示了情绪的正面和负面、乐观和悲观、积极和消极等。根据情绪的不同主题,文本情绪的研究对象主要包括媒体语调(媒体新闻)、管理层语调(当事公司管理层讨论与分析、环评报告以及其他公开披露的信息文件)、公民情绪(网络论坛发帖)等。

  媒体情绪度量媒体报道内容中包含的乐观与悲观情绪。通常来看,媒体负面语气能够解释邻避问题的风险和解决方案,但正面语气却没有解释能力。

  管理层的信息披露往往能反映管理层的决策和意图,信息公开不全面、甚至相关信息空白,环评报告独立性存疑,相当于利益集团放大了邻避效应,无助于问题的解决。

  文本大数据为度量公民情绪提供了新的数据源。一方面,由于公民越来越倾向于选择在网络论坛上发布相关的评论帖子或者做出相关搜索,这些文本数据能直接反映他们对邻避事件的看法、对当前状态的解读以及与自身决策相关的信息。另一方面,这些数据易获得且覆盖群体范围广,满足了从不同频率、不同层面研究情绪与邻避风险关系的需求。

  传统的数据指标和环境问题治理之间的关系不稳定,且只能反映部分信息,与传统数据相比,文本数据覆盖领域广泛、信息可以被很多个体所获取、并且新闻内容可能与当前和未来状态密切相关。利用文本数据度量公民关注的环境问题采用的主要指标有搜索指数、阅读频率数据和论坛发帖量等。作为信息的制造者和传播者,媒体的关注和倾向一方面可以影响普通公民对环境问题治理的关注,另一方面也影响信息的传播效率和模式。

  媒体对环境政策的变动和未来趋势可能产生很重要的影响,比较典型的例子是“PM2.5”、“雾霾”等关键词在一段时间内在媒体中频繁出现,推动了PM2.5的数据公开以及《大气污染防治行动计划》等一系列治理大气污染改善空气质量政策措施的出台与实施。相比而言,传统的自上而下的政策颁布实施时间跨度较长,而主流新闻媒体的新闻文本、网络搜索短时间内同一关键词频繁出现,对新的环境政策的实施具有明显的促进作用。

  统筹规划,协同推进文本数据资源整合,建设现代化高技术的数据中心,加强内部共享和动态更新;整合信息平台,逐渐形成统一的互联网文本数据平台,实现信息的有效共享和开放交换;建立文本数据正负面清单,完善健全文本数据开放制度和机制,提高各政府部门和社会机构的文本数据开放热情。

  加强文本大数据处理和分析的技术创新、建立一体化的大数据平台和完善的数据管理体系,通过对文本大数据的高效采集、有效整合,加强对政府数据的共享开放和社会数据的挖掘应用,提升环境问题决策能力,提高风险防范水平,进一步深化环境治理的精准性和有效性。

  今年上半年,我国发明专利授权39.3万件,实用新型专利授权147.3万件,外观设计专利授权38.3万件。

  7月11日,当地卫生部门进行专业鉴定后通报称,该病例的血清学凝集试验为O139阳性,诊断为霍乱,毒力基因阴性。

  记者12日从中国科学院合肥物质科学研究院了解到,该院强磁场中心王辉课题组,制备出超小铜纳米晶嵌入的氮掺杂碳纳米片催化剂。

  这是自第二次青藏高原科考启动以来,学科覆盖面最广、参加科考队员最多、采用仪器设备最先进的综合性科考,共组织5支科考分队、16个科考小组、270余名科考队员参加。

  随着新一代信息通信技术和数字技术取得重大突破,数字贸易迅速发展。作为新型贸易模式,数字贸易极大减少了贸易成本和时间,不仅使新的贸易产品不断涌现,而且正在改变几乎所有行业的贸易方式和贸易规模,成为国际贸易发展的新动力。

  近日,记者从中国科学技术大学获悉:该校科研团队在相干测风激光雷达方面实现重大突破,首次实现3米和0.1秒的全球最高时空分辨率的高速风场观测。

  河北省自然资源厅日前发布古生物化石调查成果。2020年4月,张家口市宣化区发现大型恐龙足迹化石群,河北省自然资源厅立刻组织专家进行现场核实并及时上报自然资源部,同时对这一带古生物化石进行了加强保护和调查评价。

  为了从头开始构建人类心脏,研究人员需要复制构成心脏的独特结构。这包括重建螺旋几何形状——当心脏跳动时,螺旋几何形状会产生扭曲的运动。

  今年上半年,天津港集装箱吞吐量同比增长2%以上,然而碳排放强度不升反降,这一升一降之间的奥秘就藏在“绿色”和“智慧”中。随着我国港口产业掀起绿色智慧化转型的浪潮,积极打造绿色生态港口,加强港口领域污染防治与节能减排已经成为业内的共识。

  2022年中国航海日活动周已经启动。中国航海学会11日发布预测认为,如果对制约发展的因素采取有效应对措施,2025年智能航运技术与产业化发展总体上可达到国际先进水平。

  相比之下,37.4%的公众关注“中国是否存在粮食安全问题?如何解决粮食浪费问题?”

  1972年,徐淙祥高中毕业,可他并没有选择进城当干部,而是回村做农民。“人什么时候都要吃饭,把粮种好,比干啥效益都大!”徐淙祥心想。

  “从这里招聘的学生省心,毕业生得提前定。”每年,深圳市大疆创新科技有限公司都会到天津现代职业技术学院无人机专业选学生。该公司负责招聘的工作人员告诉记者:“这儿的学生干活踏实,学习能力强,肯吃苦,有担当。”

  原本颜色发白的猪肉,经暖红色灯光照射,变得光鲜亮丽……这种通过调整光照颜色让食品看起来更“新鲜”的灯具在业内被称作“生鲜灯”,近年来在各大商店超市、生鲜市场上运用相当普遍。

  张华烈士的雕塑就立在广场对面,仿佛与他们进行着时空对话。空军军医大学基础医学院“张华队”队长王静告诉记者,自2018年开始,学校就将晚点名活动作为一项仪式固定下来,旨在引导学员们纪念英雄、争当英雄。

  海关总署7月9日晚发布公告,宣布即日起进一步优化完善进口冷链食品口岸疫情防控措施,此前境外生产企业输华冷链食品或其包装被检出新冠病毒核酸阳性将被暂停进口申报的措施同时废止。根据国务院相关工作部署,科学、精准做好进口冷链食品口岸新冠肺炎疫情防控工作,巩固疫情防控成果,保障产业链供应链安全。

  研究过十几万只蚊子的他,一直有个问题萦绕在心头:为何它们能将病毒传播得如此之快。蚊子可以快速传播疟疾、登革热、脑炎等疾病,短短半年就能让一个城市疫情横行。全球经由蚊子传播的病毒每年甚至可导致十亿人感染。

【关闭】 【打印】