Intel 與 AMD 合作弄了 x86 Ecosystem Advisory Group

好幾個地方看到,先拉新聞稿出來,兩邊的新聞稿看起來是一樣的。

Intel 的是:「Intel and AMD Form x86 Ecosystem Advisory Group to Accelerate Innovation for Developers and Customers」,AMD 的是:「Intel and AMD Form x86 Ecosystem Advisory Group to Accelerate Innovation for Developers and Customers」。

不過 Intel 這邊的有照片,居然是兩位 CEO 的合照,下面提到在 Lenovo Tech World 拍的:

Pat Gelsinger, Intel CEO, and Lisa Su, AMD Chair and CEO, at Lenovo Tech World on Oct. 15, 2024, where Intel and AMD announced the x86 Ecosystem Advisory Group. (Credit: Intel Corporation)

除了這兩家以外,還包括了兩位大老以及業界同行:

Luminaries Linus Torvalds and Tim Sweeney join founding members Broadcom, Dell, Google, Hewlett Packard Enterprise, HP Inc., Lenovo, Meta, Microsoft, Oracle, and Red Hat.

有聯合次要敵人打擊主要敵人的氛圍,ARM

Amazon EC2 讓你可以關閉 vCPU 節省軟體授權費用

在「Amazon EC2 now supports Optimize CPUs post instance launch」這邊看到的:

Amazon EC2 now allows customers to modify an instance’s CPU options after launch. You can now modify the number of vCPUs and/or disable the hyperthreading of a stopped EC2 instance to save on vCPU-based licensing costs.

以往要大量記憶體的會用 r 系列的主機,vCPU:RAM-GB 比率是 1:8,如果要再更高的話有最近推出的 x 系列,可以到 1:16。

對於使用按照 vCPU 收授權費軟體的使用者來說,有可能會希望比率再更大,尤其是應用偏 memory bound + 授權費很貴的情況。

這次 AWS 這次推出讓你關 vCPU 以及 hyperthreading 的選項,雖然機器費用不變,但軟體授權費就可以下降了:

There is no additional or reduced charge for specifying CPU options. You're charged the same as instances that are launched with the default CPU options.

不確定可以關到什麼程度,像是 x8g.48xlarge (192 vCPU + 3TB RAM) 這台機器不知道可不可以關到只有 1 vCPU,我記得實體 CPU 數量與可以控制的記憶體數量有關,虛擬化後的 vCPU 不確定會不會把限制也帶出來。

看起來是個很「有趣」而且「實用」的功能,但這些收授權費的廠商應該不會太開心,不知道會怎麼反應 XDDD

AWS 推出 Memory/CPU 比到 16:1 的 x8g 系列主機

看到「Now available: Graviton4-powered memory-optimized Amazon EC2 X8g instances」這篇公告,本來想說 Amazon EC2 的記憶體主機不是有 r8g.* 嗎,對比了一下才發現記憶體比率更高...

在七月的時候 AWS 先推出了 r8g.* 的主機,Memory/CPU 比是 8:1,也就是 8GB RAM 配 1 vCPU:「AWS Graviton4-based Amazon EC2 R8g instances: best price performance in Amazon EC2」。

這次的 x8g.* 則是到 16:1,對於吃記憶體的應用來說更適合?

以美東 us-east-1 的價錢來看,r8g.medium 是 $0.0977/hr (約 $70.344/mo),而 r8g.medium 則是 $0.05891/hr (約 $42.4152/mo),價錢多了約 65.8%,對於很偏記憶體的應用,像是 Memcached 或是 Redis 來說應該還不錯。

另外我查了一下 Reserved Instance (RI) 的價錢,這台最深的折扣 (全預付 + 三年的 RI) 居然是三折 (70% off),就算是最淺的折扣 (月付 + 一年的 RI) 也有六二折 (38% off),換算後分別是 $21.194/mo 與 $43.95/mo。

對比 Vultr 的 16GB RAM 機器,最少也要 $80/mo?雖然這邊有 2 vCPU,而且還送一定的流量,但價差還是頗明顯的。

之前沒有發現這邊的差異,意外的 AWS 在這邊的價碼頗有競爭性啊,尤其是自己用的話,網頁應用搭配 CloudFront 的 always free 方案,Amazon EC2 到 CloudFront 不用錢,然後 CloudFront 到 internet 流量的部分有一大段不用錢:

1 TB of data transfer out to the internet per month
10,000,000 HTTP or HTTPS Requests per month
2,000,000 CloudFront Function invocations per month
2,000,000 CloudFront KeyValueStore reads per month

不過目前沒有太多區域有,但頗意外的是德國法蘭克福居然在第一波,而不是愛爾蘭:

X8g instances are available today in the US East (N. Virginia), US West (Oregon), and Europe (Frankfurt) AWS Regions in On Demand, Spot, Reserved Instance, Savings Plan, Dedicated Instance, and Dedicated Host form.

ARM 版的 Windows 宣稱要改善 x86 轉譯速度

在「Microsoft gives Windows new compiler, kernel, scheduler, and x86 translation layer on ARM」這邊看到的:

Microsoft also unveiled the name for its new x86 translation layer for Windows on ARM: Prism. Microsoft told Ars Technica that Prism is as fast as Apple’s Rosetta 2, which is interesting because Apple’s M series chips contain special silicon to speed up the translation process, making me wonder if Qualcomm has done the same, or is just brute-forcing it.

看起來之前 Windows 平板上跑 x86 應用程式很慢的痛點有機會改善?另外不知道技術相似度如何,有沒有機會看到細節分析...

關於 Hacker News 上面,「假設 CPU 速度上限只有現在的 1/20」的討論

算是 Hacker News 上面的閒聊文章,如果 CPU 只有現在 1/20 的速度的話,軟體開發會變成什麼樣子:「How might software development have unfolded if CPU speeds were 20x slower?」。

其實也沒那麼難想像,如果是拿 CPU 頻率來算 1/20 的話,上限大約是 250~300MHz?這大概是 Pentium II 的年代,1997 年的 CPU,當年主流的作業系統應該是 Windows 95...

裡面有很多討論,不過在 id=39977430 這邊看到:

No electron apps.

幹。

Intel 的 X86S 計畫

清一些連結時看到的,Intel 在 2023 年提出來的 X86S 計畫在進行,在 Linux kernel 裡面可以看到 commit 消息:「Intel continues prepping the Linux kernel for X86S」,引用的消息是「Intel Continues Prepping The Linux Kernel For X86S」。

從 Intel 的文件「Envisioning a Simplified Intel Architecture」這邊可以看到一些想法,看起來開機的部分沒有 real mode 了,直接進入 protected & 64-bit 環境,而對於舊架構的需求上會是透過 CPU exception 讓 OS 或是 VMM 處理,但不知道這樣做效能會損失多少...

再來就是微軟這邊的配合度,然後是定價,以及隔壁 AMD 要不要跟,這些綜合影響到最後面市場買不買單?(除了散戶以外,還包括像 AWS 這些雲端商...)

Scaleway 的 RISC-V 伺服器

看到「Scaleway launches RISC-V servers (scaleway.com)」這篇,Scaleway 推出了 RISC-V 的伺服器:「Elastic Metal RV1」。

先看對消費者比較有感覺的部分,未稅 €15.99/mo 大約是 US$17.34/mo,有 16GB RAM 這點算是蠻有競爭力的,目前常見的 VPS 大約是 1:5 左右 (1GB RAM 大約要 $4/mo),這邊直接接近到 1:1,光是這點在吃 memory 比較重的環境下就蠻吃香的。

另外從 Scaleway 的角度來看,有蠻多特別的特性,像是超省電與超高密度:

EM-RV1 servers are extremely energy-efficient, consuming between 0.96W and 1.9W per 1.8GHz core.

Incredibly dense, a 52U rack holds up to 672 EM-RV1s!

所以一台機器的 4 core 跑滿大約是 7.6W,看功耗與手機用的 ARM CPU 有點像,只是不知道 CPU 效能到底在哪個區間,等後續看看好了?

換成 t4g.small 後的一些整理

昨天在這邊提到因為 Amazon EC2t4g.small 提供了 free tier 方案 (到今年年底),blog 主機剛好從 t4g.micro 改成用 t4g.small,到年底前可以看看有沒有 t5g 或是類似的主機出來:「往上升級或是用 Unlimited mode 撐」。

除了換完後 CPU credit 給的量上升減緩了情況以外,我在檢查時才發現 PHPopcache 的 cache 使用量也超過預設值 128MB 了,改成 192MB 後看起來 CPU usage 也有下降一些:

這點算是先前沒注意到的,上面 PHP 跑兩個 WordPress 以及一個 MediaWiki (都掛了各式各樣的 plugin & extension),還有一個自己寫的小東西,這樣會超過 opcache 的 cache 大小...

現在換到 t4g.small 後總算又開始養的起 CPU credit 了:

另外也補上幾個 CloudWatch Alarms (看起來 free tier 是十個) 監控主機的 CPUCreditBalance,然後透過 AWS Chatbot 接到自己的 Slack 上,至少之後有狀況的時候會主動通知。

t4g 的 CPU credit 被吃完了

這個站 blog.gslin.org 掛了三個多小時:

先連機器 SSH 看起來是正常的,但習慣性的 w 看一下情況發現 CPU load 有 6.x,用 top 看一下就看到幾隻 php82-fpm 跑滿 CPU,心裡大概有底是被砍站了...

先把 nginx 停下來,瞄了一下 /var/log/nginx 下面的 log 就知道是 ClaudeBot 造成的,看起來都是從 AWSus-east-1 機器打過來的。

然後翻一下 log 看看什麼時候開始打的,先看 log 已經被 gzip 起來的這些:

$ echo /var/log/nginx/blog.gslin.org_ssl-access.log.{?,??}.gz | xargs -n1 | xargs -n1 -I% sh -c "echo %; zgrep ClaudeBot % | wc"
/var/log/nginx/blog.gslin.org_ssl-access.log.2.gz
  13031  169403 1986719
/var/log/nginx/blog.gslin.org_ssl-access.log.3.gz
    459    5967   85350
/var/log/nginx/blog.gslin.org_ssl-access.log.4.gz
  14533  188929 2219819
/var/log/nginx/blog.gslin.org_ssl-access.log.5.gz
   6502   84526 1026178
/var/log/nginx/blog.gslin.org_ssl-access.log.6.gz
  32483  422279 4905919
/var/log/nginx/blog.gslin.org_ssl-access.log.7.gz
  21304  276952 3221877
/var/log/nginx/blog.gslin.org_ssl-access.log.8.gz
   7921  102973 1199356
/var/log/nginx/blog.gslin.org_ssl-access.log.9.gz
      0       0       0
/var/log/nginx/blog.gslin.org_ssl-access.log.10.gz
      0       0       0
/var/log/nginx/blog.gslin.org_ssl-access.log.11.gz
      0       0       0
/var/log/nginx/blog.gslin.org_ssl-access.log.12.gz
      0       0       0
/var/log/nginx/blog.gslin.org_ssl-access.log.13.gz
      0       0       0
/var/log/nginx/blog.gslin.org_ssl-access.log.14.gz
      0       0       0

看起來是從 blog.gslin.org_ssl-access.log.8.gz 這邊開始的,大概是 1/25 開始 (機器上面是 UTC 時間):

-rw-r----- 1 www-data adm   1894325 Jan 26 00:00 /var/log/nginx/blog.gslin.org_ssl-access.log.8.gz

然後再來看一下最近的 log,看起來是這兩天打的特別重,到五萬多:

$ echo /var/log/nginx/blog.gslin.org_ssl-access.log{,.?} | xargs -n1 | xargs -n1 -I% sh -c "echo %; grep ClaudeBot % | wc"
/var/log/nginx/blog.gslin.org_ssl-access.log
  29436  382668 4387703
/var/log/nginx/blog.gslin.org_ssl-access.log.1
  51712  672256 7852345

拉了 AWS 的圖來看跟預期的差不多:

機器是 t4g.micro 而且沒開 burstable,先前差不多都是略低於 10% 的線在跑,剛好利用 CPU credit 的概念,這幾天看起來就是被打而跑上去。

好像該補一下 alarm,丟到我自己的 Slack 以及 Pushover...

AMD 在 AM4 腳位上再出四顆 CPU...

看到 AMD 的新聞稿楞了一下:「AMD Reveals Next-Gen Desktop Processors for Extreme PC Gaming and Creator Performance」。

出了四顆 5000 系列的 CPU 在 AM4 主機板上使用:

New AMD Ryzen™ 5000 Series Desktop Processors Bring More Performance to Legacy Socket AM4 Platforms

其中 5700X3D 這顆價錢算是很殺的 (US$249),對於吃 CPU cache 很重的遊戲會是個有趣的選擇,先前 X3D 最便宜的是 5800X3D (US$449),這顆算是個有趣的玩具...

另外 5500GT 這顆 US$125 也是個蠻有趣的產品,剛剛翻了一下原價屋上的 5600G 是 $4970,換算大約是 US$160,不確定是不是屬於輕量機種的範圍... (像是組給家裡老人家用?)

意外的讓 AM4 平台又多了一些硬體可以玩?