跳至內容

維基百科討論:使用時光機

頁面內容不支援其他語言。
維基百科,自由的百科全書


Wayback Machine存檔後的頁面消失

雖然不是維基百科的工具,但是想問問有沒有遇到相同情況的朋友。因條目需要,參考Wikipedia:使用時光機,使用Wayback Machine存檔該頁面後,提示存檔成功並生成了存檔鏈接,一開始是可以正常查看的,但一段時間後頁面轉而提示「The Wayback Machine has not archived that URL.」,嘗試了兩次都是同樣的情況。該站點似乎並沒有robots.txt文件,並且也存在其他頁面的正常存檔。由於存檔鏈接已經添加到條目中,在這種情況下是否應該先移除存檔鏈接呢?--立日留言2021年6月23日 (三) 10:20 (UTC)[回覆]

如果您說的是這筆存檔,我剛剛到web.archive官網上去重新操作一次就成了,您可以在天主教廈門教區下方直接點擊看看,不過紀錄時間是剛剛的下午六點多,也沒看到你先前的存檔,可能有些技術問題吧。此外就算在官網存檔,我也偶爾會遇到類似你說的狀況,要過幾個小時才找的到。如下次再遇到這種情況,我會建議先放著,過至少幾小時到官網上確認有沒有存到檔,沒有就重新存一次。--迴廊彼端留言2021年6月23日 (三) 11:05 (UTC)[回覆]
@迴廊彼端:謝謝,我剛剛可以打開您提供的這版本的存檔,但現在似乎又再次失效了。--立日留言2021年6月23日 (三) 11:26 (UTC)[回覆]
@迴廊彼端:不好意思,似乎是間歇性失效,突然存檔又出現了。感覺不是很穩定的樣子。--立日留言2021年6月23日 (三) 11:31 (UTC)[回覆]

Wayback Machine不能存檔am730的網頁,大家能推薦其它存檔方法嗎?

am730似乎只能從香港訪問,內中報道如[1]在用Wayback Machine存檔時出錯。求推薦其它存檔方法。謝謝!--Benevolen留言2022年1月9日 (日) 03:30 (UTC)[回覆]

去Google搜一下然後看網頁快照,比如你這個。快照--在下荷花請多指教歡迎簽到2022年1月9日 (日) 10:26 (UTC)[回覆]
@Benevolen--在下荷花請多指教歡迎簽到2022年1月9日 (日) 10:26 (UTC)[回覆]
感謝指點!還改為這個功能不復存在了--Benevolen留言2022年1月9日 (日) 20:54 (UTC)[回覆]
看來需要程序員開發開源的網頁存檔器以供我們自建。--Txkk留言2022年1月9日 (日) 13:42 (UTC)[回覆]
有了!ArchiveBox --Txkk留言2022年1月10日 (一) 11:57 (UTC)[回覆]

谷歌網頁快照能存檔多久?

我找到一個光明日報來源,但是光明網上的頁面已經被刪除了,然而谷歌網頁快照還存了檔,我現在在該來源的存檔URL里填的網頁快照網址,這個會被谷歌刪除嗎?如何能把谷歌快照的內容備份進web archive?--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月26日 (三) 14:49 (UTC)[回覆]

會刪,不確定保留多久,可能幾周到幾個月吧。archive.is支持存檔和索引(檢索)谷歌快照,但該網站最近似乎下線了。web archive我不確定能否存檔快照,經測可以。以前是不行的,因為robots.txt以前不存、會刪2017年4月開始忽略。--YFdyh000留言2022年10月26日 (三) 17:30 (UTC)[回覆]
「但該網站最近似乎下線了」,並沒有。根據en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服務,可能會打不開這個網站。你用了什麼翻牆軟件?--Txkk留言2022年10月28日 (五) 10:01 (UTC)[回覆]
感謝提示,困擾已久。可能軟件配置和網站問題兼有,出問題時可能在調用OpenDNS。之前訪問總是看到nginx的歡迎頁面,https正常,所以我以為網站故障了。--YFdyh000留言2022年11月1日 (二) 10:20 (UTC)[回覆]
但是我存了以後發現webarchive好像最後存的是光明網首頁,你能試試看怎麼在web archive存谷歌快照嗎--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月27日 (四) 03:42 (UTC)[回覆]
見我那個「可以」的鏈接。快照頁面會因JS自動跳轉到光明網,必須想辦法(比如禁用JS,或者改URL參數)打開純文字版來存檔。其實不存檔也非不行,應該還有圖書館能查到,不過存檔了更方便查證就是。--YFdyh000留言2022年10月27日 (四) 03:45 (UTC)[回覆]
哦沒事了,存好了--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月27日 (四) 03:44 (UTC)[回覆]
Google 頁庫存檔一段時間後會刪的。建議妳用 https://web.archive.org/save 存檔。 -- Shyangs留言2022年10月26日 (三) 17:38 (UTC)[回覆]
網址不是必須的。--Kethyga留言2022年10月27日 (四) 05:10 (UTC)[回覆]

標題文本

存不了的網站……

昨天晚上發現知乎zhihu.com似乎保存不了……存檔結果是「您當前請求存在異常,暫時限制本次訪問」

應該還有幾個國內大網站不能保存。

  • 淘寶taobao.com
  • 新浪微博weibo.com
  • 網易雲音樂music.163.com

--Zyksnowy留言2022年11月24日 (四) 04:42 (UTC)[回覆]

順路報告,近幾個月,用archive.is查看或存檔知乎頁面,似乎無法成功,且會導致archive.is網站不再能正常訪問(出現異常cookie)。不知道其他人是否能重現。--YFdyh000留言2022年11月24日 (四) 05:39 (UTC)[回覆]
這四個網站都有單獨的圖片服務器,可以單獨保存……可能容易丟失網址

提議對WP:WBM達成共識,對條目內鏈接儘量在未失效前進行網頁存檔

下列討論已經關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

因為WP:WBM只是論述,不屬於方針或指引,為避免出現網頁失效,提議將WP:WBM達成共識,規範使用網站時光機,對網頁預防性進行保護,同時有方針指引可儘量避免發生不必要的編輯戰。——航站區留言2024年9月18日 (三) 15:36 (UTC)[回覆]

首先,這是操作指南;其次,從你的發言中可以看出你並不理解什麼是「共識」。--自由雨日🌧️留言貢獻 2024年9月18日 (三) 15:42 (UTC)[回覆]
我對於共識的理解來源於WP:CON,另外我說的是把WP:WBM達成共識,規範使用網站時光機,以免沒任何約束性,每個編者可以根據自己的習慣或者喜好,想加就加想刪就刪,避免編輯戰的出現--航站區留言2024年9月18日 (三) 15:55 (UTC)[回覆]
請解釋約束性和為何能避免編輯戰。--YFdyh000留言2024年9月18日 (三) 18:28 (UTC)[回覆]
沒有約束 你覺得加也是對的 他覺得減也是對的 就會出現編輯戰,例如Special:Diff/84256834Special:Diff/84256939Special:Diff/84257817Special:Diff/84258012Special:Diff/84258178--航站區留言2024年9月18日 (三) 18:37 (UTC)[回覆]
實際上任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,況且維基還有機器人InternetArchiveBot,我的看法是不應強制用戶使用IABotManagementConsole或手動添加存檔網址,也不用特別鼓勵或建議。反而是如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,應嚴禁其他用戶復原或刪除相關編輯。--HanTsî留言2024年9月18日 (三) 18:52 (UTC)+1 [回覆]
你這個觀點我認同,畢竟沒有規矩不成方圓--航站區留言2024年9月18日 (三) 19:02 (UTC)[回覆]
支持。--糯米花留言2024年9月18日 (三) 22:38 (UTC)[回覆]
(+)支持,不強制添加,但添加後不應刪除。--Uyi liu2 幸泉居士✍️ 2024年9月19日 (四) 01:24 (UTC)[回覆]
「應嚴禁其他用戶復原或刪除相關編輯」,IABot出過好幾次故障了,更何況嚴禁的話,是否有考慮任何不應嚴禁的特殊情況?--百無一用是書生 () 2024年9月19日 (四) 02:07 (UTC)[回覆]
能夠形成一個共識即可,以免公說公有理婆說婆有理--航站區留言2024年9月19日 (四) 02:21 (UTC)[回覆]
故障的編輯直接視同為破壞處理就行了。--HanTsî留言2024年9月19日 (四) 04:34 (UTC)[回覆]
這裡我想邀請另一方當事者@Txkk君,請至此處討論,謝謝。--薏仁將🍀 2024年9月19日 (四) 02:44 (UTC)[回覆]
謝邀。各位(除了航站區)把我的意思都表達出來了,我就沒什麼可補充了的。--Txkk留言2024年9月20日 (五) 01:38 (UTC)[回覆]
任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,機器人InternetArchiveBot添加存檔網址,可視情況進行刪改。
不應強制用戶使用IABotManagementConsole或手動添加存檔網址。但如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,原則上嚴禁其他用戶復原或刪除相關編輯。

大家可以討論一下,結合了我、User:ShizhaoUser:HanTsî的觀點——航站區留言2024年9月19日 (四) 02:52 (UTC)[回覆]

我認為相關說明應該放在Wikipedia:列明來源(或者Wikipedia:外部連結)上(並且對應Wikipedia:失效鏈接),而不是將一本說明書打上格式指引的標籤。雖然明白提議者的想法。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:07 (UTC)[回覆]
PS.其實Wikipedia:失效鏈接裡面就說過,除了使用網頁存檔服務外,可以在引用模板摘錄出引述條目語句的原文,這樣也可以起到參考內容「存檔」的作用。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:14 (UTC)[回覆]
因為現階段討論的是,在有效期內提前存檔問題,閣下提及的是失效補救問題,好像方向不一樣啊--航站區留言2024年9月19日 (四) 04:12 (UTC)[回覆]
道理一樣,就是「插入外部連結來源作為參考資料時,應該建議同時做一次頁面存檔(然後手工加上存檔頁或者IABot添加)」,Wikipedia:失效鏈接看上去亡羊補牢,但同時也是防患未然。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:18 (UTC)[回覆]
@Cwek那閣下覺得,其實是不是可以把這個提議和上面一個提議合併?--航站區留言2024年9月19日 (四) 04:19 (UTC)[回覆]
嗯,其實大致就是上面的議題,添加上本操作手冊來配合操作。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:24 (UTC)[回覆]
不知道上面的提議者是否願意合併?--航站區留言2024年9月19日 (四) 04:28 (UTC)[回覆]
「大致就是上面的議題(提議對維基百科:列明來源的網頁部分新增關於存檔的要點),添加上本操作手冊來配合操作」,我認為說得足夠清晰了。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:45 (UTC)[回覆]

( π )題外話:頁面中的存檔鏈接也有保護隱私的效用。部分用戶在同時可以選擇的情況下仍然會優先訪問存檔鏈接。——暁月凜奈 (留言) 2024年9月19日 (四) 04:51 (UTC)[回覆]

這個有待商榷,比如機器人五年前的網頁存檔,但是這個網址到現在還能訪問,並且該網頁界面和五年前已經有很大變化了,這個時候訪問網頁存檔就沒有什麼意義了。我希望機器人能不能每隔一段時間把網頁存檔的未過期的網頁進行存檔更新,這樣不至於網頁存檔和網站隨着時間的流逝,差別越來越大--航站區留言2024年9月19日 (四) 04:59 (UTC)[回覆]
不認可。網站的內容可能會發生變化,以編者加入維基百科時的內容(當時的存檔)為準最為穩妥。--糯米花留言2024年9月19日 (四) 05:27 (UTC)[回覆]
那如果「外部連結」呢?比如一些作品的官網,比如五年前加入的網頁存檔和現在界面出現了很大差異,我覺得「外部連結」放置作品官網地方應該以截止他失效前最新狀態為主--航站區留言2024年9月19日 (四) 08:27 (UTC)[回覆]
我覺得外部連結通常不該加存檔鏈接,只是機器人經常加。--YFdyh000留言2024年9月19日 (四) 10:33 (UTC)[回覆]
IABot的管理界面支持URL的存檔狀態更新的。但看情況是否需要更新存檔頁面的數據,不強制為規範性條文。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 05:46 (UTC)[回覆]
機器人有個不智能的地方就是,一個條目存檔過了的鏈接,下次就不會再重新存檔了,我希望能設計成每隔一段時間機器人自動探測,把網頁存檔的未過期的網頁進行存檔更新,這樣不至於網頁存檔和網站隨着時間的流逝,差別越來越大--航站區留言2024年9月19日 (四) 08:30 (UTC)[回覆]
這應該是IAbot的問題,請跟IAbot的維護者反饋。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 11:30 (UTC)[回覆]
就事論事,鼓勵網頁存檔本就沒啥問題,也是落實本站可供查證的基本原則,我看不出來有什麼爭議可言?—— Eric Liu 創造は生命(留言留名學生會 2024年9月19日 (四) 06:23 (UTC)+1 [回覆]

本討論已關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

提醒:互聯網檔案館暫時無法使用

已通過
已有其他較詳細討論,故關閉此議題。—— Eric Liu 創造は生命(留言留名學生會 2024年10月26日 (六) 21:51 (UTC)[回覆]
下列討論已經關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

archive.org目前顯示「Temporarily Offline」,從昨天的新聞[3]來看可能是遭駭客攻擊。--EzrealChen留言2024年10月11日 (五) 08:54 (UTC)[回覆]

最近數日也顯示當機無法進行新存檔。不過對於一個喜歡快速刪除十餘年以前的文章、塑造民眾記憶的審查機制來說,WebArchive就是他們最大的敵人吧。--Allervousシカ部・ざ・ろっく! 2024年10月19日 (六) 00:13 (UTC)[回覆]
(~)補充:可以跟下面那一段討論Wikipedia:互助客棧/其他#Internet_Archive已暫停多日合併。--Allervousシカ部・ざ・ろっく! 2024年10月19日 (六) 00:14 (UTC)[回覆]

本討論已關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

Internet Archive已暫停多日

Internet Archive已暫停多日,有點擔心線上來源的備份。大家有沒有聽說什麼消息?--Factrecordor留言2024年10月13日 (日) 05:10 (UTC)[回覆]

見上面#提醒:互聯網檔案館暫時無法使用。簡言而之,被DDoS了,沒攻成後用其他攻擊手段掘到了用戶數據,之後漏了出去[4]。這情形一般都是要關掉外部連接以免進一步受攻擊,之後再在內部修復漏洞,修完後才會放出來。至於被攻擊的原因呢,承認是次攻擊責任的組織表示是出於以巴戰爭當中美國政府的立場[5]--S叔 2024年10月13日 (日) 05:52 (UTC)[回覆]
見到時光機剛剛再次上線[6]。--Uranus1781留言2024年10月14日 (一) 08:11 (UTC)[回覆]
他們的推特有在更新進展:https://twitter.com/internetarchive/ ,目前為只讀狀態,無法添加新存檔。--Tim Wu留言2024年10月14日 (一) 08:13 (UTC)[回覆]
養成了同時在archive.today和Internet Archive存檔的習慣……希望IA能挺過去。--Tim Wu留言2024年10月14日 (一) 08:18 (UTC)[回覆]
其實需要小工具支援更多存檔網站(甚至同時存檔功能)為是。—— Eric Liu 創造は生命(留言留名學生會 2024年10月14日 (一) 09:02 (UTC)[回覆]
不知道何時能夠恢復--航站區留言2024年10月29日 (二) 13:07 (UTC)[回覆]

現在是只能瀏覽,不能使用Save Page Now(新增頁面存檔)。archive.is(作為備胎)也是不錯的,和Internet Archive最大的區別就是頁面爬完後會把javascript給凍結掉,這個有時是優點(例如部分新聞網頁的付費牆用is能繞過但ia無法繞過)有時也是缺點(例如無法展開摺疊內容)。--💊✖️2️⃣3️⃣留言2024年10月16日 (三) 10:30 (UTC)[回覆]

其他還有Webarchive.io,不過Internet Archive用最多資料也較齊全,這樣下去也不是辦法。 --窩法乙烷 兒法夢碎 2024年10月16日 (三) 13:33 (UTC)[回覆]
話說是否有服務器設於中國大陸的存檔服務?--Tim Wu留言2024年10月16日 (三) 14:11 (UTC)[回覆]
百度快照? --窩法乙烷 兒法夢碎 2024年10月16日 (三) 14:21 (UTC)[回覆]
不是早沒了?——Sakamotosan路過圍觀 | 避免做作,免敬 2024年10月17日 (四) 10:55 (UTC)[回覆]
百度百科自己有參考資料預覽(就是點進參考資料鏈接不會直接進入原始內容,會先打開存檔),但是還得編輯百度百科,所以等於沒有。 ——魔琴身份聲明 留言 貢獻 新手2023 2024年10月18日 (五) 05:40 (UTC)[回覆]
今年Google在取消緩存服務後,改為與IA合作(不知道這樣搞IA是不是多了個大金主不愁沒人捐錢了),結果沒過多久就發生ddos的事情……--💊✖️2️⃣3️⃣留言2024年10月16日 (三) 16:05 (UTC)[回覆]
這麼多天過去了,添加網頁存檔(Save Page Now)的功能還是不能用……這ddos攻勢一打威力有這麼大……--💊✖️2️⃣3️⃣留言2024年10月28日 (一) 10:46 (UTC)[回覆]
[7]之前已說了,攻撃的手段除DDoS外還有其他。共有三波攻撃,由不同人士策動。主要都針對API tokens。"In the Internet Archive breach, hackers stole access tokens, allowing them to bypass security measures and gain entry into sensitive platforms, such as Zendesk. This allowed them to access user data, including support tickets without needing a password."--S叔 2024年10月30日 (三) 13:38 (UTC)[回覆]
更:目前IABot的頁面已停用(希望這代表技術團隊正努力讓它復原🫠)--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月3日 (日) 02:29 (UTC)[回覆]
我剛剛發現網際網路檔案館的自動存檔功能似乎已經恢復了,官方擴充功能也得以重新運作。—— Eric Liu 創造は生命(留言留名學生會 2024年11月4日 (一) 12:21 (UTC)[回覆]
手動保存也恢復了,真是太好了。--Tim Wu留言2024年11月4日 (一) 12:26 (UTC)[回覆]
https://iabot.wmcloud.org/index.php
但這個好像還沒好的樣子?--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月4日 (一) 13:06 (UTC)[回覆]
二更:IABot已可正常運作--樹葉上的o(* ̄▽ ̄*)ブ木漏れ日 2024年11月6日 (三) 05:00 (UTC)[回覆]