Fake GitHub Star 的生意

昨天在 Hacker News 首頁上看到「Tracking the Fake GitHub Star Black Market (dagster.io)」這篇,原文在「Tracking the Fake GitHub Star Black Market with Dagster, dbt and BigQuery」這邊。

作者群想要偵測 GitHub 上面 fake star 的行為,所以就跑去找黑市買,然後找到了兩家,Baddhi Shop (1000 個 $64) 與 GitHub24 (每個 €0.85,大約是 $0.91),價錢差異很大,「品質」差異也很大:貴的 star 在一個月後還是存在,而便宜的看起來有一些有被 GitHub 偵測到而清除掉:

A month later, all 100 GitHub24 stars still stood, but only three-quarters of the fake Baddhi Shop stars remained. We suspect the rest were purged by GitHub’s integrity teams.

接下來就是想要系統化分析,切入點是 GH Archive 這個服務,可以直接下載 GitHub 全站上的 public evnets 資料:

GH Archive is a project to record the public GitHub timeline, archive it, and make it easily accessible for further analysis.

想要偵測兩種不同的 fake account,第一種是 obvious fake account,定義成這樣:

  • Created in 2022 or later
  • Followers <=1
  • Following <= 1
  • Public gists == 0
  • Public repos <=4
  • Email, hireable, bio, blog, and twitter username are empty
  • Star date == account creation date == account updated date

從定義就可以看出來完全就是灌水帳號,開出來就沒在動的。從 screenshot 可以看出這種帳號長的都一樣:

另外一種則是透過演算法去分析,這邊拿 unsupervised clustering 類的演算法分析出來的結果,可以看到抓到很多:

最近 NN 類的 machine learning 演算法太多,看到這些傳統的 machine learning 演算法還是覺得頗新鮮的...

NIST 選出了四個 Post-Quantum Cryptography 演算法

NIST (NSA) 選出了四個 Post-quantum cryptography 演算法 (可以抵抗量子電腦的演算法):「NIST Announces First Four Quantum-Resistant Cryptographic Algorithms」。

四個演算法分別是:

  • CRYSTALS-Kyber:非對稱加密。
  • CRYSTALS-Dilithium:數位簽名。
  • FALCON:數位簽名。
  • SPHINCS+:數位簽名。

這次沒看到非對稱加解密的演算法...

然後翻了 Hacker News 上的討論,果然一堆人在討論 NIST 能不能信任的問題:「NIST Announces First Four Quantum-Resistant Cryptographic Algorithms (nist.gov)」。

然後據說 Kyber 這個名字出自 Star Wars,Dilithium 這個名字則是出自 Star Trek,這還真公平 XDDD

用 NN 演算法重製 Full HD 版的 Star Trek: DS9

看到「Remastering Star Trek: Deep Space Nine With Machine Learning」這篇,裡面用了類神經網路演算法,將本來只有 480p (SD) 的 Star Trek: DS9 升到 1080p (Full HD) 的版本,而且看起來效果還不錯...

意外的看到有人拿 Star Trek 的材料來玩... 依照作者的說明,DS9 一直沒有 Full HD 版的其中一個原因反而是因為「數位化」了。使用類比膠卷的母帶可以透過更高規格的重新掃描而得到高畫質版本,但 DS9 的母帶似乎已經是數位版了,所以反而造成無法透過重新掃描的方式取得 Full HD 版本:

While you can rescan analog film at a higher resolution, video is digital and can't be rescanned. This makes it much costlier to remaster this TV show, which is one of the reasons why it hasn't happened.

現有的 upscale 技術主要都還是以圖片為主,所以作者本來以為對於動態畫面的處理會遇到問題,但蠻意外的超出預期,從影片可以看出來:

看起來之後的 remaster 版本有可能可以靠這個方法先做初步,然後再讓人進去修?

Walmart 在賣場要導入機器人取代人類的工作了...

在「Walmart will soon have robots roaming the aisles in 50 stores」這邊看到 Walmart 要導入機器人取代人類的工作了,像是架上沒貨或是標籤錯誤或沒標的:

The robots go up and down the aisles, scanning for out-of-stock items, incorrect prices, and wrong or missing labels.

像是這樣的機器:

或是在掃描時更明顯的照片:

如果一直讓機器來換掉人類能做的事情,是不是有機會到後來就沒有工作需要做?如果當全世界都實行「無條件基本收入 (Unconditional Basic Income)」時,會不會愈來愈接近 Star Trek 裡面講到未來的經濟體系,沒有貨幣時情況?不曉得兩百年後會是什麼樣子...

Stack Overflow 做的 Developer Survey 2016

Stack Overflow 對開發者發問卷後把結果整理出來了:「Stack Overflow Developer Survey 2016 Results」,約 56k 個樣本數:

This year, 56,033 coders in 173 countries answered the call.

整個問卷分成五塊區域:Overview、Developer Profile、Technology、Work、Community,其中 Overview 的部份是給時間不多的人看的,整理了一些比較特別或是有趣的重點:

Most developers prefer dogs to cats. (But not developers in Germany.)

(唔?)

要注意的是,問卷只有英文版本,所以這份問卷明顯對於英文非母語的開發者會有比較低的填寫意願,會造成統計偏差問題,所以在讀之前要注意到:

Surveys aren’t perfect. While our large sample size helps offset some biases, it’s still biased against devs who don't speak English, or who don't like taking English-language surveys.

另外是有女性對這份問卷表示不滿:「Stack Overflow’s developer survey analysis hurts women」,尤其是 Stack Overflow 標示了只有 5.8% 的女性,這會導致女性樣本數在答案細分族群時的統計偏差的問題會很嚴重。

另外這篇文章的作者也對 Stack Overflow 裡的結論很不滿意。

回到原來文章,有些東西還蠻有趣的:

其中 Salary 這段應該是很多人都有動力去讀一讀了解的,裡面還包括了各地區與麥當勞的大麥克指數的相對數值分析,讓你有個參考值可以感覺。

Twitter 把收藏變成心狀後的使用成長

在「Twitter Sees 6% Increase In “Like” Activity After First Week Of Hearts」這邊看到 Twitter 把 Favorite 變成 Like 後的成長:

The reason? According to Weil, “It’s easier to understand.” Makes sense. How many favorites could you really have at the end of the day? The increase is 6% for existing users and 9% for new users.

不過,更多的 Like 會有更多的互動嗎?

2017 年將有新一季的 Star Trek...

剛剛看到 2017 年將會有最新一季的 Star Trek:「New Star Trek Series Premieres January 2017」。

Star Trek 在科技史上是部很重要的影集與一系列的電影,在 NASA 裡甚至有很多人是被 Star Trek 所影響才加入 NASA 的。

明年 2016 年將會有五十週年活動:

Star Trek, which will celebrate its 50th anniversary in 2016, is one of the most successful entertainment franchises of all time.

來等看看好了,之前有些 series 有點雷,新的不知道怎樣 XDDD

美國政府正式拒絕死星建造計畫...

起於去年十一月時,有人在白宮We the People 網站上發起建立死星的請求 XDDD

該份請願書在「Secure resources and funding, and begin construction of a Death Star by 2016.」。依照規定,請願超過兩萬五千人後,白宮必須給予正式的回覆。

於是... 白宮就正式回覆了 XDDD 回覆是由 Paul Shawcross (Chief of the Science and Space Branch at the White House Office of Management and Budget) 掛名。BBC 中文網給了很短的說明 (不過把重點都提到了):「美國未批准修建星球大戰式太空站」。

在回覆內容中,標題的「This Isn't the Petition Response You're Looking For」是有梗的... 可以參考 IMDBStar Wars 的名言錄:「These aren't the droids you're looking for.」。

條列式列出三個政府反對的原因,第一條還很正經解釋預算問題。第二條就很正經的歪掉:

The Administration does not support blowing up planets.

而第三條直接說「啊這東西沒用啦~」:

Why would we spend countless taxpayer dollars on a Death Star with a fundamental flaw that can be exploited by a one-man starship?

解釋完後,後面就在推廣 ISS 與最近的成就... XD