User talk:Air7538/沙盒02

页面内容不支持其他语言。
维基百科,自由的百科全书
import pywikibot
import re
import time
from collections import defaultdict
site = pywikibot.Site('zh', 'wikipedia')
gen = site.newpages(namespaces=0, patrolled=False, returndict=True)
pagetext = ""
catext = ""
userlist = defaultdict(int)
sum = 0
for pageCat, info in gen:
    # print(pageCat.title()) #未巡查条目列表
    # print(pageCat.text)
    if not re.search(r'\[\[(Category|分類|分类|category):|{{(Uncategorized|Copyvio|消歧義|Notability|bd)', pageCat.text):
        catext = catext + "[[" + pageCat.title() + "]]、"
        # print(catext)
    sum += 1
    userlist[info['user']] += 1
    # print(userlist)
userlistcnt = defaultdict(list)
for user, cnt in userlist.items():
    if cnt <= 1:
        continue
    userlistcnt[cnt].append(user)
for cnt, users in sorted(userlistcnt.items()):
    pagetext += str(cnt) + "条 "
    pagetext += '、'.join(users) + "\n\n"
page = pywikibot.Page(site, "User:Air7538/沙盒02")
localtime = time.asctime(time.localtime(time.time()))
page.text = "此时共有" + str(sum) + "条条目未巡查,当前创建未巡查条目最多的用户:\n\n" + pagetext + "以下条目可能存在潜在的分类问题:\n\n" + catext + "\n\n统计于:" + localtime
print(page.text)
page.save("维护页面:未巡查条目 and 潜在分类问题。v2")

Q & A

  • 特别感谢Xiplus对程式码的修改(Special:diff/65150400),此次变更已经于Special:diff/65151250推送到Toolforge上。另外每小时此讨论页对应的沙盒02都会被重写,除自动更新外所有对沙盒02的修改均不会得到长期保存。

Q:为什么筛选的有红字条目?

  • A:默认Pywikibot似乎不会检查近期页面移动,很多红字条目都是被移动过的。

Q:为什么消歧义有如N字消歧义这样的分类还是被选中了?

  • A:因为N字消歧义是模板代入的,还有很多这样的情况没有被过滤出来。
  • 最后感谢迴廊彼端的提醒(互助客栈其他版2021年4月),原来有一个特殊页面叫Special:未归类页面。我似乎又在“造轮子”了 囧rz……

--Air7538留言2021年4月11日 (日) 04:25 (UTC)[回复]

判断分类不正常的几种情况

  1. 页面wiki文本没有分类的:
  1. [[Category: 不在wiki文本内,
  2. [[分類: 不在wiki文本内,
  3. [[分类: 不在wiki文本内,
  4. [[category: 不在wiki文本内。
  1. 其他情况:
  1. {{Uncategorized 页面wiki文本已经被标记未分类维护模板,
  2. {{Copyvio 页面正在进行版权验证,
  3. {{消歧義 页面是消歧义,
  4. {{Notability 页面不符合维基百科的关注度要求,
  5. {{bd 页面存在生卒年份模板,可能存在的嵌入分类。