Press "Enter" to skip to content

STWP 2024 第 42 周周报

本周新闻:

  • IA 即便宕机也要办活动 —— Escaping the Memory Hole 活动将于下周周三 2024-10-23 17:00 (UTC+8) 开始并有线上直播。活动主题是:「在一个主要娱乐网站一夜之间消失、流媒体毫无征兆地从平台上消失的世界里,我们的数字文化面临着被抹去的风险。有哪些保障措施可以保存我们的集体记忆?」
  • WordPress Foundation 向 IA 捐款十万$。究竟是人文关怀还是公关支出?

STWP 本周进展:

  • 某项目:单机数据库迁副本集。重构,错误处理,Redis 队列,并行化。 @luoingly
  • 天涯小筑:打好了 warc ,等待上传。 @yzqzss
  • 某项目:4 号开始,已存四千万 post/comment ,预计下星期到目标高度。 @yzqzss
  • 某项目:新适配了一个目标网站。 @Ovler

STWP 基建:

  • 听闻 MongoDB 8.0 有性能提升,于是升级了。现在没荷载,不知性能改进的真假。
  • 用超了 Grafana Cloud 的免费 10k metrics,遂自建 Grafana&Prometheus。大家都说“好用爱用”。

本周趣闻:

  • 我们的三个 pypi 包本月的下载量激增到 4.9k/4.5k/2.3k。木有头绪。
  • 在 IA 宕机的这段时间里, pypi 包 internetarchive 的下载量骤降。twitter
  • 我们 biliarchiver 包的下载量大约是上游依赖包 bilix 的一半。
  • Zeno 最近实现了“将 DNS 记录写进 warc 元数据”的功能,但没有实现 DNS fallback。这意外地让我们发现了 Hetzner 机子上长期以来各种对外网络请求超时的原因—— /etc/resolv.conf 中的第一个 nameserver 实际上无法使用。(hetzner 屏蔽了对外 DNS 请求,需要用它的自有 DNS,但 hetzner 没有屏蔽对这些 DNS ip 的 icmp ping。于是 systemd-resolver 发现能 ping 通 8.8.8.8/1.1.1.1 一众 DNS,延迟跟 Hetzner DHCP 下发的自有 DNS 差不太多,就在 /etc/resolv.conf 把这些实际被屏蔽的公共 DNS 设为首选,DHCP 下发的作为 Fallback)。
  • 我们有台机子被禁了 UDP,时间漂了,故寻找不靠 UDP(NTP) 同步时间的优美方法。发现 HTP 这种从多个 http server 的 Date: header 取时间的方式非常地“优美”,非常 web 。还真别说,用上 HTP 这玩意后,发现它精准度还不错,误差最多十几毫秒级呢。另见:《HTP 笑传:扔掉 UDP,试试并不特殊的低精度时间同步》 by @wowjerry 。
  • @rowink:matrix.org 觉得 search.saveweb.org “有些rss输出markdown,搜索结果看着会有点乱”,想给它加个 markdown 渲染。而后他创建了他来到 GitHub 以来的第一个 PR,这个 PR 没有实现目标,他在后续的 PR 中完成吗?敬请期待。
  • 我有旧硬盘可以送你们》故事主人公的后续:“硬盘已经被其他人分得七七八八了,因为实验室搬了”。
发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注