Elasticsearch 打算要回來提供 AGPL 授權

在「Elasticsearch is open source, again (elastic.co)」這邊看到的,Elasticsearch 目前是自家的 ELv2 以及 SSPL 授權,現在打算要提供 AGPL 授權了:「Elasticsearch is Open Source, Again」。

不過應該也不會回去用了,之前 Elastic 的大小動作太多,像是直接在新版 client SDK 上擋掉所有不是 Elasticsearch 的伺服器端 (所以 OpenSearch 就被擋了):「Elasticsearch error "The client noticed that the server is not Elasticsearch and we do not support this unknown product"」。

既然 OpenSearch 堪用就繼續用?反正在雲上面大多也都不是自己架,而是用現成的。

另外這幾年 PostgreSQL 上面做 fulltext search 的套件愈來愈多,也是個常用的方案?(量大的時候 read replica 拆出去就不太會影響到 main DB 效能)

AWSOpenSearch 看起來證明了換 license 對這些大公司沒什麼用,這些大公司有的是錢跟人可以 fork 出來自己搞... 所以想要一開始沾 open source 的名字不如一開始就用 AGPL?

Mistral AI 與 NVIDIA 一起推出的 12B 開源模型 Mistral NeMo

如標題寫的,兩邊都有新聞稿:「Mistral NeMo」、「Mistral AI and NVIDIA Unveil Mistral NeMo 12B, a Cutting-Edge Enterprise AI Model」。

Mistral AI 這邊的新聞稿比較技術性一點,列出來的比較是拿 9B 的 Gemma 2 與 8B 的 Llama 3,整體看起來是還不錯:

裡面也有提到主要的特點是名為 Tekken 的 tokenizer 更有效率,不過這個部分我覺得聽聽帶過,畢竟 12B 還是比 9B 大了 1/3 左右,或是比 8B 大了 1/2 左右,優勢大不少,但看數據不知道導底是什麼地方貢獻的...

從 NVIDIA 這邊的新聞稿列出來的則比較合理,是透過硬體的觀點提到這個 12B model 可以跑在一張 4090 上 (24GB VRAM):

Designed to fit on the memory of a single NVIDIA L40S, NVIDIA GeForce RTX 4090 or NVIDIA RTX 4500 GPU, the Mistral NeMo NIM offers high efficiency, low compute cost, and enhanced security and privacy.

不過即使可以這樣跑,目前比較有效率的跑法應該是應該都會找 quantization 版本來跑,通常 model 會變小不少,而且損失應該也還在能接受的範圍。

常見的窮人跑法是拿 16GB VRAM 的 4060Ti 或是 12GB VRAM 的 3060,就看各種 tradeoff。

更重要的意義應該還是在這個區間又多了一個開源 model,而且是 NVIDIA 有出手掛名參與的?這陣子比較接近的應該是微軟的 Phi-3-medium-4k-instruct & Phi-3-medium-128k-instruct,大小是 14B。

NVIDIA 正式推出開源版本的 Linux driver 了

五月的時候有提過 NVIDIA 有計畫要使用 open-source license 的 Linux driver:「Nvidia 在 Linux 上安裝核心驅動程式時將建議使用開源版本」,現在則是正式公告了:「NVIDIA Transitions Fully Towards Open-Source GPU Kernel Modules」。

支援的 GPU 分成三塊,第一塊是只有 open-source 版本有支援,目前已經推出的產品應該是只有 GH200 是這個架構:

For cutting-edge platforms such as NVIDIA Grace Hopper or NVIDIA Blackwell, you must use the open-source GPU kernel modules. The proprietary drivers are unsupported on these platforms.

然後是 Turing 後的架構,以桌機顯卡來說的話是 2016 年出的 20 系列架構 (值得提一下的是,16 系列雖然看起來數字比較小,但是是 2019 年出的 Turing 架構,所以也支援):

For newer GPUs from the Turing, Ampere, Ada Lovelace, or Hopper architectures, NVIDIA recommends switching to the open-source GPU kernel modules.

舊的系列則是不支援,以桌機來說就是 10 系列以及更舊的卡:

For older GPUs from the Maxwell, Pascal, or Volta architectures, the open-source GPU kernel modules are not compatible with your platform. Continue to use the NVIDIA proprietary driver.

再等一兩個版本再來換過去...

話說找資料發現維基百科上面用 Nvidia,但我找資料發現官方名稱是用 NVIDIA,翻了討論頁發現 2010 年就有人幹剿過了 (在 Naming Conventions 這段),看起來是不會改?

Openpanel:Mixpanel 的 Open Source Clone

在「Show HN: Openpanel – An open-source alternative to Mixpanel (github.com/openpanel-dev)」這邊看到的專案,GitHub 頁面在「Openpanel」這邊。

主要是因為 Mixpanel 的價錢很詭異,另外作者也希望可以同時追蹤一般常見的 pageview 資訊 (像是 GA4 或是 Plausible),所以作者就跳下來自己寫了...

除了 self-hosted 版本以外,也有 cloud 版本可以先看看介面,或是丟一些量進去看看操作起來如何。

Winamp 打算要放出程式碼

在「Winamp has announced that it is "opening up" its source code (winamp.com)」這邊看到的消息,原公告則是在「Winamp has announced that it is opening up its source code to enable collaborative development of its legendary player for Windows.」這邊。

這篇公告上面的「Dec 16, 1」不知道是什麼... Anyway,預定今年九月的時候公開程式碼,在 id=40383890 這邊有提到可能的原因:

Winamp's owners have been going through financial difficulties since last year and as a result have laid off the skeleton crew they previously had maintaining Winamp (their main focus seems to be a streaming service also called Winamp for HTML5 and phones). This looks like they're willing to let the community take over maintenance for PC Winamp, which beats letting it die IMO.

銀河的歷史又翻過了一頁?

Nvidia 在 Linux 上安裝核心驅動程式時將建議使用開源版本

在「NVIDIA to install open Linux kernel modules by default」這邊看到的新聞,引用的連結是官方的討論區「Unix graphics feature deprecation schedule」這篇。

從 560 開始會議建議使用開源版本:

Starting in the release 560 series, it will be recommended to use the open flavor of NVIDIA Linux Kernel Modules 204 wherever possible (Turing or later GPUs, or Ada or later when using GPU virtualization).

點進去看「Open Linux Kernel Modules」這頁可以看到開源版本有一些專屬功能 (在「The following features will only work with the open kernel modules flavor of the driver」這段),蛋也有一些功能是開源版本沒有的 (在「The following features are not yet supported by the open kernel modules」這段)。

另外 Known Issues 這邊有提到些效能與功耗上的差異。

看起來是 porting 的差不多了?我覺得可以再等一兩個版本 XD

XZ 的後門事件,以及 OpenJS Foundations 也遇到類似的問題

XZ 的後門事件從暴發出來也已經一個多月了,大多數的證據也都分析的差不多了,是差不多可以回顧一下... 然後發現維基百科上面也已經有條目了:「XZ Utils backdoor」,中文版也有:「XZ实用程序后门」。

這次是 open source community 遇到社交工程 (social engineering) 的攻擊,攻擊者順利透過社交手法取得 maintainer & developer 的身份,接下來是慢慢埋 backdoor 的過程。

目前看起來後門是判斷特定的 SSH key 就放行,所以屬於 RCE 類的漏洞,CVSS 給了 10.0 的最高威脅分數。

另外隔壁棚 OpenJS Foundations 也遇到類似的問題:「Open Source Security (OpenSSF) and OpenJS Foundations Issue Alert for Social Engineering Takeovers of Open Source Projects」,在「Failed Credible Takeover Attempt」這段有提到因為 OpenJS Foundations 是因為 security working group 擋下這次的 social engineering。

這是 xz 因為是 backdoor,所以在 performance profiling 時異常而被抓出來,如果是 exploitable 的話就難抓了... 這次的 social engineering 之後有看到一些不同的討論,有些是技術上把 security auditing 拆出來一起做,另外一種是要確保參與的 maintainer & developer 的真實身份。

已經可以看到影響了...

OpenTofu 釋出第一個 GA 版本 1.7.0

從去年八九月從 Terraform fork 出來並且改名後 (「OpenTF 宣佈從 Terraform 最後一個 Open Source 版本 fork 出來」、「OpenTF (Terraform 的 fork) 改名為 OpenTofu」),總算是推出第一個 GA 版本了:「OpenTofu 1.7.0 is out with State Encryption, Dynamic Provider-Defined Functions, and more」。

除了把 trademark 相關的東西換掉以外,還實作了一些功能,這樣化半年弄出個起頭,接下來看後續的能量?好像還行...

可以線上查出入境的日期記錄

Threads 上看到可以查出入境記錄 (以及其他各種資料),連結在 https://www.threads.net/@allenwongtw/post/C6OwgH_Bi3Y/ 這邊:

用了一下還蠻方便的,可以用自己門號的手機認證 (另外確認資料的部分是身分證字號 + 健保卡卡號 + 出生日期),拉下來的檔案是 PDF,有出境日期與入境日期。

看了一下才發現 2019 年因為工作的關係,出入境的次數比 2015 年還多... 本來以為 2015 年是最多次的。

MS-DOS v4.0 的程式碼以 MIT license 釋出

Hacker News 上的消息「Open Sourcing DOS 4 (hanselman.com)」,原文在「Open Sourcing DOS 4」。

Hacker News 裡面的討論有拉出一些有趣的 source code 註解,不過我比較好奇為什麼是挑 v4.0 而不是其他版本,看說明應該是剛好遇到對的人與對的團體?

A young English researcher named Connor "Starfrost" Hyde recently corresponded with former Microsoft Chief Technical Officer Ray Ozzie about some of the software in his collection. Amongst the floppies, Ray found unreleased beta binaries of DOS 4.0 that he was sent while he was at Lotus. Starfrost reached out to the Microsoft Open Source Programs Office (OSPO) to explore releasing DOS 4 source, as he is working on documenting the relationship between DOS 4, MT-DOS, and what would eventually become OS/2. Some later versions of these Multitasking DOS binaries can be found around the internet, but these new Ozzie beta binaries appear to be much earlier, unreleased, and also include the ibmbio.com source.

這些程式碼主要都是考古分析用了,不知道什麼時候 MS-DOS 6.22 的 code 會冒出來...