第 15 周项目摘要
- 尝试联系 wikiteam bot 的原所有者无果,于是在 wikiapiary 上部署了我们的 savewebbot 。
- 准备/宣传 第一届存档马拉松活动(主题是 DokuWiki 存档)。
- 给 savewebbot 开了 10 线程,wikiapiary 管理员说 bot 编辑页面频率太猛。于是加上1分钟编辑一次的限制。
- 原来的 wikiteam bot 用很灵车的正则来改 wikitext 。弃用,saveweb bot 改用“更科学”的方法。
- 继续 写/修 播客存档工具。修了个 RSS 的 enclosure 如果报非法的大小,工具会炸的 BUG 。
- 应 wikiteam IRC 中 @JAA 的请求,存档了 https://wiki.bash-hackers.org/ 这个 DokuWiki 站点。 IA iteam
讨论摘要
除了IA,我目前没发现其他同时(合规地)满足无限容量、免费、长时间存储和不是那么离谱的审查这么多要求的中心化存储服务。
by matrixuser
最近的种种热潮又让我意识到,人类对于当下种种发展进程的记录整理是高度不足的,而且受到热点流行事件干扰和屏蔽。比如说,最近 AI 相关的产物,绝大多数都没能记到维基百科之类的地方。
这会造成什么结果呢?被侥幸记录下来的少数分子,却会成为未来追寻这段历史的代表象征。造成遗憾、失真和误解。
by @RainSlide
有没有什么自动存档b站指定up主甚至自动存档自己收藏夹里视频的工具啊。
by @qgpCRUqgBG97w231
今天终于有点时间看看 dokuwiki-dumper,然后看到 requirements 的最后一个,差点理解成得是 rich 的人才能用了(x
by @liangyongxiang
STWP 好像和 miHoYo 的 slogan 有点点像。(字面上)
草,Archivist Save The World 是吧。
在 wikiapiary 上采花蜜的 Saveweb bot
WikiTeam 在 wikiapiary.com 上的 WikiTeam Bot 自从 2016 年来就不工作了,此后上传到 IA 的 wikidump (MediaWiki 站点备份) 都没有很好地链接到 wikiapiary 中。再加上 wikiapiary 在 {{website}}
模板里提醒用户“wikidump 相关信息_是由 wikiteam bot 自动维护的,手动编辑会被覆盖_”,更是打消了很多编者手动维护相关信息的想法。
此后 wikiapiary 上除了 fandom.com 的 wikidump 信息有个 [[User:Shufflertoxin]]
bot 在少量维护外,基本就停滞了。
我们写了个新 bot [[User:Savewebbot]]
,然后把它部署到 wikiapiary 上了,它正在把 8 年来上传到 IA 的 wikidump 重新和 wikiapiary 链接起来。
这个 bot 可以帮助我们(以及其他人)从 wikiapiary 中筛选出还没被存档的 MediaWiki 站点,然后……存存存存存。
源代码: https://github.com/saveweb/wikiapiary-wikiteam-bot (修改自 wikiteam/wikiteam 的旧代码)
- wikiapiary 此前宕机了几个月,它的 bot 积压了大量队列任务,再加上刚升级到 MediaWIki 1.39.2 ,他们还在调查数据库性能问题,所以现在不是很稳定,打开要多等一会儿,刷新几下。
用存档的方法将濒临消失的网络资料拯救下来。