Category Archives: CMS

維基百科每天的 PageView 數據 (2015/07/01 開始)

不只是維基百科,還包括所以維基基金會的專案都可以查到,精確度可以到每日。 MediaWiki 系統提供的 API 在維基基金會上的專案都關掉了。主要是因為維基基金會的專案量太大,前方有大量的 cache 擋住,後端能提供的資料其實沒有意義。取而代之的是另外規劃出來的 API。 API 的介紹說明在「Analytics/PageviewAPI」這邊可以看到,官方所提供的完整 API 說明文件則可以在「Wikimedia REST API」這邊查到。 實際測試發現資料從 2015/07/01 開始,每日更新的速度還不錯,像是 UTC 還是 2016/07/31 的現在可以取到 2016/07/30 的資料了。舉例來說,想要拉中文版 Kalafina 在 2016 七月由人閱覽的資料: https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/zh.wikipedia/all-access/user/Kalafina/daily/20160701/20160731 如果是想拉日文版的就換成 ja.wikipedia: https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/ja.wikipedia/all-access/user/Kalafina/daily/20160701/20160731

Posted in CMS, Computer, Murmuring, Network, Wiki, WWW | Tagged , , , , , , | Leave a comment

MediaWiki 的 EmailDiff 套件

先前 MediaWiki 所提供的「變更通知」都只有在信件裡「通知」,而沒有在信件裡列出「改變的內容」,這使得讀信的人要再點進去看... (於是就懶的點了) 而前陣子看到有人寫了 extension 來輸出 diff,解決了這個問題:「MediaWiki extension EmailDiff: notification emails improved」。 信裡變成有這樣的內容: Version differences: @@ -846,5 +887,3 @@ In cattle, temperament can affect production traits such as carcass and meat quality or milk yield as well as affecting … Continue reading

Posted in CMS, Computer, Mail, Murmuring, Network, Software, Wiki | Tagged , , , , , , | Leave a comment

使用 WordPress 的內容佔有全 Web 的 25% 比率

WordPress 的 Matt Mullenweg 在他的 blog 上提到了 WordPress 的內容建構了 Web 上的 25% 內容:「Seventy-Five to Go」,出自 W3Techs 的「 Historical yearly trends in the usage of content management systems for websites 」這邊的資料。 WordPress 從 2004 年 MovableType 的 license 爭議事件後崛起 (Commitment to … Continue reading

Posted in Blog, CMS, Computer, Murmuring, Network, Software, WWW | Tagged , , , , , , , | Leave a comment

維基媒體的效能資訊

在「Wikimedia Performance Metrics」這邊看到維基媒體 (Wikimedia) 的效能資訊網頁:「Metrics — Wikimedia Performance」,這邊是以前端效能為主。在「Grafana」這邊則包括了更多的資訊。 在「Performance」這邊有關於效能頁面的說明,看起來還在開發...

Posted in CMS, Computer, Database, MariaDB, Murmuring, Network, Programming, Software, Wiki, WWW | Tagged , , , , | Leave a comment

Wikipedia 引入 Mentor 制度

在「Get help editing Wikipedia with the new “Co-op” mentorship program」這邊看到英文版維基百科引入了導師的制度。 以往比較資深的編輯都是直接修正,或是到新手的 Talk 頁上提出建議,現在則是引入了導師的制度,從而得到了不錯的成果。 首先是編輯次數的成長: Mentored editors were more productive than compared to editors who were not mentored. During the pilot, mentored editors made 7 times as many edits (35 vs. … Continue reading

Posted in CMS, Computer, Murmuring, Network, Social, Wiki, WWW | Tagged , , , | Leave a comment

Wikimedia (包括維基百科) 推出 HSTS (強制使用 HTTPS)

Wikimeda 宣佈所有旗下的網站都會啟用 HTTPS 與 HSTS:「Securing access to Wikimedia sites with HTTPS」。 在這之前,使用者可以用 EFF 的 HTTPS Everywhere 強制使用 HTTPS (在 Firefox 與 Google Chrome 都有上架),而這次則是全面強制使用了。 愈來愈多人使用 HTTPS 來保護隱私後 (而不僅僅是保護機密資料),接下來的問題就是要想辦法在 DNS 上保護了。也就是可以利用 DNS query pattern 知道你在看哪種 (或是哪一個) 頁面。

Posted in Browser, CMS, Computer, DNS, Firefox, GoogleChrome, Murmuring, Network, Security, Software, Wiki, WWW | Tagged , , , , , , , , , | 1 Comment

Google 發表計算網頁真實性的演算法 (Knowledge-Based Trust)

Slashdot 上看到 Google 發表了計算網頁真實性的演算法,Knowledge-Based Trust (KBT):「Google Wants To Rank Websites Based On Facts Not Links」,原始的論文 PDF 檔案可以在「Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources」這邊取得。 論文本身的原理不難懂 (其實方法相當有趣),主要是給出了三個貢獻。 首先是能夠區分是取出資訊的方法有問題 (extract 的演算法不夠好),或是網站本身就給出錯誤的資訊: Our main contribution is a more sophisticated probabilistic model, which can … Continue reading

Posted in Blog, CMS, Computer, Murmuring, Network, Search Engine, Spam, WWW | Tagged , , , , , , , , , , , , , | Leave a comment

Wikipedia 換成 HHVM 的成果

維基百科基金會的人發表了將 PHP 換成 HHVM 後的成果:「How we made editing Wikipedia twice as fast」。 可以看到編輯存檔時間大幅改善: 另外是已登入使用者 (通常是經常參與編輯的使用者) 的頁面產生時間也大幅改善: 另外帶來的好處是 CPU 使用率的下降: 再來就是看 PHP 7 能追上多少了...

Posted in CMS, Computer, Murmuring, Network, Programming, Software, Wiki, WWW | Tagged , , , , , | Leave a comment