Press "Enter" to skip to content

STWP 2023 第 15 周周报

第 15 周项目摘要

  • 尝试联系 wikiteam bot 的原所有者无果,于是在 wikiapiary 上部署了我们的 savewebbot 。
  • 准备/宣传 第一届存档马拉松活动(主题是 DokuWiki 存档)。
  • 给 savewebbot 开了 10 线程,wikiapiary 管理员说 bot 编辑页面频率太猛。于是加上1分钟编辑一次的限制。
  • 原来的 wikiteam bot 用很灵车的正则来改 wikitext 。弃用,saveweb bot 改用“更科学”的方法。
  • 继续 写/修 播客存档工具。修了个 RSS 的 enclosure 如果报非法的大小,工具会炸的 BUG 。
  • 应 wikiteam IRC 中 @JAA 的请求,存档了 https://wiki.bash-hackers.org/ 这个 DokuWiki 站点。 IA iteam

讨论摘要

除了IA,我目前没发现其他同时(合规地)满足无限容量、免费、长时间存储和不是那么离谱的审查这么多要求的中心化存储服务。
by matrixuser

最近的种种热潮又让我意识到,人类对于当下种种发展进程的记录整理是高度不足的,而且受到热点流行事件干扰和屏蔽。比如说,最近 AI 相关的产物,绝大多数都没能记到维基百科之类的地方。

这会造成什么结果呢?被侥幸记录下来的少数分子,却会成为未来追寻这段历史的代表象征。造成遗憾、失真和误解。
by @RainSlide

有没有什么自动存档b站指定up主甚至自动存档自己收藏夹里视频的工具啊。
by @qgpCRUqgBG97w231

今天终于有点时间看看 dokuwiki-dumper,然后看到 requirements 的最后一个,差点理解成得是 rich 的人才能用了(x
by @liangyongxiang

STWP 好像和 miHoYo 的 slogan 有点点像。(字面上)
草,Archivist Save The World 是吧。

在 wikiapiary 上采花蜜的 Saveweb bot

WikiTeam 在 wikiapiary.com 上的 WikiTeam Bot 自从 2016 年来就不工作了,此后上传到 IA 的 wikidump (MediaWiki 站点备份) 都没有很好地链接到 wikiapiary 中。再加上 wikiapiary 在 {{website}} 模板里提醒用户“wikidump 相关信息_是由 wikiteam bot 自动维护的,手动编辑会被覆盖_”,更是打消了很多编者手动维护相关信息的想法。

此后 wikiapiary 上除了 fandom.com 的 wikidump 信息有个 [[User:Shufflertoxin]] bot 在少量维护外,基本就停滞了。

我们写了个新 bot [[User:Savewebbot]],然后把它部署到 wikiapiary 上了,它正在把 8 年来上传到 IA 的 wikidump 重新和 wikiapiary 链接起来

这个 bot 可以帮助我们(以及其他人)从 wikiapiary 中筛选出还没被存档的 MediaWiki 站点,然后……存存存存存。

源代码: https://github.com/saveweb/wikiapiary-wikiteam-bot (修改自 wikiteam/wikiteam 的旧代码)

  • wikiapiary 此前宕机了几个月,它的 bot 积压了大量队列任务,再加上刚升级到 MediaWIki 1.39.2 ,他们还在调查数据库性能问题,所以现在不是很稳定,打开要多等一会儿,刷新几下。

One Comment

  1. 林林
    林林 2023-07-27

    用存档的方法将濒临消失的网络资料拯救下来。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注