今年的 EFF Awards 頒給了 Sci-Hub 的創辦人 Alexandra Elbakyan

在「Sci-Hub’s Alexandra Elbakyan Receives EFF Award for Providing Access to Scientific Knowledge」這邊看到 EFF 把今年的 EFF Awards 頒給了 Sci-Hub 的創辦人 Alexandra Elbakyan。而 EFF 原始的公告在「Electronic Frontier Foundation to Present Annual EFF Awards to Alexandra Asanovna Elbakyan, Library Freedom Project, and Signal Foundation」這邊。 維基百科對 Sci-Hub 的介紹在開頭說的頗清楚,Alexandra Elbakyan 選擇無視 copyright,提供論文免費下載: Sci-Hub is a shadow library website that provides free … Continue reading "今年的 EFF Awards 頒給了 Sci-Hub 的創辦人 Alexandra Elbakyan"

Alexa.com 宣佈將在 2022 年五月退役

Hacker News 上看到的消息,Alexa.com 將在 2022 年五月退役:「We will be retiring Alexa.com on May 1, 2022」,對應的討論在「We will be retiring Alexa.com (alexa.com)」這邊。 討論裡面有提到一些替代方案,大概只有 similarweb 堪用,另外也有提到「Tranco」這個: A Research-Oriented Top Sites Ranking Hardened Against Manipulation 歷史啊...

Mozilla 對 Alexa Top 1M Sites 的分析

Mozilla 對 Alexa Top 1M Sites 偏安全面向的分析:「Analysis of the Alexa Top 1M Sites」。 對一般情況比較有用的應該是看絕對數字,也就是哪些功能是大家都優先採用了... 然後可以看出 HPKP 跟 SRI 果然是大家都懶得上的功能 (事倍功半 XDDD)。 另外也可以當作是安全性確認的 list,把 HTTP header 類的安全性設定都放上去了。

Alexa Top 1M 網站使用 HTTPS 的改善

Mozilla 觀測 Alexa Top 1M 網站,對 HTTPS 使用情況的分析:「Analysis of the Alexa Top 1M sites」。 可以看到比較明顯的是 HTTPS 以及 HTTP → HTTPS Redirection 這兩塊: 不過用 Alexa 的資料有種怪怪的感覺啊... 在討論 HTTPS (有點在推廣的感覺),但 Alexa 的網站現在是做反過來的 HTTPS → HTTP Redirection XDDD

快速衝高 Alexa 排名的方法

很久前 (突然找到我在 2006 的文章) 就說 Alexa 只是個參考用的工具... (參考「Search Results for: alexa」) 如果要看結論的人請直接跳到文章尾部,中間是說明發現的過程。 昨天 (星期五) 的時候跑去找肥睡睡餵食「摩斯吃到飽」,然後 xdite 也一起亂入,剛好聊到兩件事情。 第一件事情是要幫友站 Logdown 測試流量,講了一堆嘴砲方式... (惡搞的方式先拿掉了) 第二件事情是前天 (星期四) 的時候我發現前公司 pixnet.net 的 Alexa 從六月開始排名突然爆增,大約從全球 600 名跳到 120 名,台灣排名的部份居然超越了 YouTube (目前 PIXNET 在第五名,YouTube 在第六名),但到達率、PV、停留時間都沒有大的變化,就問問 xdite 與肥睡睡有沒有什麼想法,是不是最近有上什麼功能是我沒注意到的 XD 不過餵食席間沒有討論出結果來,吃飽後閃人了... (我不確定肥睡睡有沒有吃飽啦,不過我是不怎麼餓...) 回到家後想說來研究 Logdown 使用的服務,asset 什麼的就先不管好了,到是有一段 code 我之前沒遇過: Update:結果回到家後研究 Logdown 的服務,就看到 xdite 把 Alexa 的 … Continue reading "快速衝高 Alexa 排名的方法"

Alexa 的不準確性 (續)

在 Alexa 的不準確性 提到有許多人對於 Alexa 以 Web Traffic 作為的評分方式質疑後,當然就會有人試著去找替代的方案。 在 (Mis)Tracking Web Traffic 所引用的 Web Numbers: What's Real? 這篇就有人去用不同的方法分析網站的排名,結果得出一些相反的結論。 這就讓很多網站開始緊張啦,因為廣告主會開始質疑「是不是值得投資這麼多錢」... :p

Alexa 的不準確性

Slashdot 這篇 Alexa, Amazon's Most Flawed Idea 所引用的 Alexa: Amazon’s Most Flawed Idea 這篇文章提到 Alexa 易於「操控」(提供假資料),同時會因為頁面設計過爛 (像 Myspace) 導致連線數量較多而排名較高,另外更重要的是 Alexa Toolbar 是 IE only,所以對於某些站台完全沒有意義。 多沒意義呢?依照 Alexa 的資料,Slashdot 在目前的排名是 227 名 (Related Info for: slashdot.org),但 Slashdot 有 75% 的人是使用 Firefox,如果把這些人都算進去的話...: 更不用說根本不是以 Windows 為導向的站,MacRumors 只有 13% 的使用者用 IE... 所以當有人說他的站在 Alexa 排名多前面的時候,聽聽就好,因為 1) 可以自己寫程式造假 2) 他的站設計的很爛,造成要抓取多次才能完成一個動作 3) 只有 … Continue reading "Alexa 的不準確性"

GitHub 新版 Code Search 後面砍掉重練的過程

在 Hacker News 上看到「Lessons from building GitHub code search (youtube.com)」這篇在講 GitHub 的 Code Search (今年九月在 Strange Loop 上的演講),同時演講者 Luke Francl (帳號是 100k) 也有在 Hacker News 上留言回答一些問題: 影片裡面有不少資訊,挑我自己覺得有趣的地方整理一下。(不是依照影片的順序) 首先是現成的 search engine (Elasticsearch) 會濾掉太多資訊,其中一種例子就是在程式語言中,各種 token 像是 <、= 以及 > 這些,都算是有用的資訊。 另外一方面是 Elasticsearch 的架構下沒有辦法利用 fork 的性質 (以及 Git 的 branch 性質),所以在處理 fork 類的 repository 會造成大量重複的資料,但 fork 的資料會有 99% … Continue reading "GitHub 新版 Code Search 後面砍掉重練的過程"