维基百科:《维基人》/第十四期/新闻和期刊摘录
新闻和期刊摘录
路标:德语维基文库结束了长达15年的校对计划
(本文部分摘录自英语维基百科杂志《路标》2020年7月号新闻版块)
德语维基文库社群日前完成了重要德语传记丛书《德意志人物志》的在线版本,约包含26,345篇条目。完成此一计划所需的工作包括更正、校对在其他地方发布的光学字符识别(OCR)扫描文本,并需经四眼原则确认,以符合社群的质量要求。事实上,数字化《德意志人物志》计划启动的时间点还先于德语维基文库本身正式独立的时间点,早在德语维基文库于2005年自维基文库孵育场(wikisource.org,时为sources.wikipedia.org)分离之前就已经开始。尽管费时15年之久,本计划仍较当年初版《德意志人物志》纸本出版的速度快上许多,后者整整花了37年,自1875年一路到1912年才出版完毕。在本计划进行的同时,另一个由政府资助的计划亦完成了《德意志人物志》的数字化,不过德语维基文库社群成员、档案学家克劳斯·格拉夫声称由社群完成的版本质量较好。
《德意志人物志》的后继丛书《新德意志人物志》于1953年出版首卷,全套丛书预计将于2023年完成。自2010年起,德语维基文库社群亦已经准备开始对《新德意志人物志》的数字化工作,但基于目前的著作权法律限制,可能要等到22世纪,整部《新德意志人物志》才能全部进入公有领域。
维基媒体研究通讯:维基百科如何跟进COVID-19的研究
(本文部分摘录自元维基杂志《维基媒体研究通讯》2020年6月号)
荷兰阿姆斯特丹大学的一名研究人员乔凡尼·科拉维扎(Giovanni Colavizza)近期在开放获取预印本数据库bioRxiv预发表了一篇有关维基百科上的2019冠状病毒病疫情相关条目的论文〈维基百科中的COVID-19研究〉(COVID-19 research in Wikipedia),介绍了维基百科的编者是如何搜寻整理有关信息的。自疫情爆发以来,(英语维基百科)已有大约20,000篇有关条目创建,那么这些条目是如何保证质量的呢?
笔者自PubMed、bioRxiv、WHO等公开可获取的资源中创建了代表COVID-19研究的语料库,总共包含60,000多种出版物。为了确定这些出版物是否已经运用在维基百科的条目当中,笔者调用了Altmetric的数据,检查维基百科条目中引用文献的出版物标识符(例如DOI)是否匹配。
借此,此研究得以深入解析维基百科中COVID-19相关编辑工作的一些趋势。首先,编者们似乎有余力应付数量迅速增加的相关文献。根据统计,大约3%的出版物至少被维基百科引用过一次。考虑到2020年的出版物数量较往年增长了10倍以上,此一数据对于近年来出版的出版物而言更加符合。第二,编者们在主题多样性方面引用了大量具有代表性的文献样本。将这些文献以隐含狄利克雷分布模型分为7个主题后,可以得知各个主题在维基百科中的覆盖范围反映了科学文献的整体失衡(多数研究以冠状病毒和公共卫生及流行病为研究主题)。第三,编者基本遵循与2020年以前相同水平的参考资料质量标准(参见《医学可靠来源指引》[编辑组注:此处指英文维基百科,中文维基百科本地的《医学可靠来源指引》日前甫成为正式指引]),多数依靠具有影响力(例如曾被新闻或博客提及),且在经过同行评审的专业期刊(例如《柳叶刀》)里出现的研究,同时较少使用预印本文献。
此研究的主要限制之一是仅包括了维基百科条目中对科学出版物的引用情况。因此,未来的研究方向包含维基百科的条目内容、条目的编辑历史,以及将维基百科与专家对COVID-19的评论进行比较。
附录:〈维基百科中的COVID-19研究〉导言
维基百科是互联网上的主要知识来源之一。在(COVID-19)大流行的头几个月里,(英语)维基百科创建了超过4,500条有关COVID-19的条目。截至4月初,这些条目大约获得了2.5亿次阅览。自COVID-19疫情爆发以来,关于COVID-19本身以及疫情发展的文章不断在线发表。维基百科(相关条目)的内容基于以科学文献为主的可靠来源。考虑到目前的危急形势以及维基百科所扮演的公众角色,依靠具有代表性的、可靠的科学结论就显得十分重要。笔者对维基百科中COVID-19相关条目的引用覆盖面进行了评估,结果表明维基百科的编者能很快将最新的研究成果集成到条目中。此外,他们能从关于COVID-19的最新研究中选出最具代表性的文章,使条目能够体现相关研究的全貌。在以文章为层次进行评估后,笔者发现本文讨论的所有主题基本都能在维基百科中得到合理的呈现。笔者还使用了回归分析的方法创建了关于维基百科引用的模型。结果表明,尽管跟上最新研究不是一件容易的时期,维基百科编者通过依靠经同行评审、高引用数、在社交媒体中得到广泛转发的文章(完成条目的编写)。