Category Archives: Programming

又一篇戰文:討論 TDD 的過程

最近在 39th International Conference on Software Engineering 上受邀參加說明的論文,在 The Morning Paper 上看到的:「A dissection of the test-driven development process: does it really matter to test-first or test-last?」。 論文本身在「A Dissection of the Test-Driven Development Process: Does It Really Matter to Test-First or … Continue reading

Posted in Computer, Murmuring, Programming, Software | Tagged , , , , , , | Leave a comment

StackOverflow 發 Tab/Space 戰文

StackOverflow 直接拿薪水戰 Tab 與 Space 的差異啊 XDDD:「Developers Who Use Spaces Make More Money Than Those Who Use Tabs」。 這下糟糕了 XDDD

Posted in Computer, Murmuring, Programming | Tagged , , , , , , | Leave a comment

關於圍棋貼目的問題...

前陣子 AlphaGo 大獲全勝後放出了五十盤自戰棋譜 (兩台 AlphaGo 自己下),其實有件事情有點出乎大家意料,而在圍棋界被一直討論。就是在這五十盤裡,黑棋與白棋的勝率比是 12:38 (中國規則,黑棋貼 7.5 目的情況),明顯白棋有強大的優勢。 這個 7.5 目指的是,由於黑棋先下 (先手優勢),所以圍的地會比較多,為了彌補白棋後下的這個缺點,一般都會設計「貼目」這個規則。 交大資工的 CGI 團隊在上個月月底發了一篇論文 (參考「CGOS Whole Period Ratings for 19x19 Board」這邊的記錄,在有參加 CGOS 的團隊裡只輸新版的 Zen),討論 value network 的新想法:「Multi-Labelled Value Networks for Computer Go」。 他們對貼目的數量做了分析: For the training data, … Continue reading

Posted in Computer, Game, Go, Lab, Murmuring, NCTU, Programming, Recreation | Tagged , , , , , , , , , , | Leave a comment

用 Machine Learning 調校資料庫

AWS AI Blog 在月初上放出來的消息:「Tuning Your DBMS Automatically with Machine Learning」。 Carnegie Mellon Database Group 做的研究,除了預設值以外,另外跟四種不同的參數做比較,分別是 OtterTune (也就是這次的研究)、Tuning script (對於不熟資料庫的人,常用的 open source 工具)、DBA 手動調整,以及 RDS: MySQL: PostgreSQL: 比較明顯的結論是: Default 值在所有的 case 下都是最差的 (無論是 MySQL 與 PostgreSQL 平台,以及包括 99% 的 Latency 與 … Continue reading

Posted in AWS, Cloud, Computer, Database, Murmuring, MySQL, Network, PostgreSQL, Programming, Service, Software | Tagged , , , , , , , , , , , , , , , , , , , , , , , , , , , | Leave a comment

Reddit 的 Deploy 機制 (的歷史)

Reddit 主要是用 Python 寫的,這邊介紹了他們歷年來的 Code Deploy 系統:「The Evolution of Code Deploys at Reddit」。 最早期的時候 (2007 到 2010) 是用 rsync 更新程式碼,然後跑個迴圈用 ssh 連進去重跑: # build the static files and put them on the static server `make -C /home/reddit/reddit static` `rsync /home/reddit/reddit/static … Continue reading

Posted in Computer, Murmuring, Network, Programming, Service, Social, Software, WWW | Tagged , , , , | Leave a comment

把嵌上去的字幕重新轉回文字

雖然這篇用的方法很簡單,但因為太符合本 blog 的副標,所以還是寫下來介紹:「Extracting Chinese Hard Subs from a Video, Part 1」。 作者想要把字幕拉出來,他直接把這張圖丟進 OCR,然後失敗 XDDD: 他決定拉出下半段: 再做 thresholding: 最後再 OCR 取得文字: ′…′二′′′'′ 怎么去逯么远的地方 '/′ 雖然很粗糙,但已經可以感覺到「幹壞事是進步最大的原動力」的感覺了 XDDD 而且看起來會有續集,會用比較精緻的技巧來處理?

Posted in Computer, Movie, Murmuring, Programming, Recreation, Software, Television | Tagged , , , , , , | Leave a comment

Symfony 4 將放棄 HHVM

PHP 7.x 的效能已經趕上 HHVM (甚至在某些項目超越,參考下面的連結),這使得後來大家為了相容性與擴充性的考量,HHVM 的社群一直沒有成長 (參考「PHP Versions Stats - 2017.1 Edition」這邊,作者從 packagist.org 上得到的數據): PTS: PHP 7.1 vs. PHP 7.0 vs. HHVM Benchmarks HHVM vs PHP 7 – The Competition Gets Closer! 這使得 Symfony 決定在 Twitter 上蒐集意見,而後決定下一個 major version (4) … Continue reading

Posted in Computer, Murmuring, Programming, Software | Tagged , , , , , , , , , | 1 Comment

透過 NN (類神經網路) 訓練好的系統,直接把圖片轉成程式碼

這個禮拜被 AlphaGo 洗臉後,又看到來搶工作的東西了:「pix2code: Generating Code from a Graphical User Interface Screenshot」。 直接把 Mockup 圖檔丟進去,然後就把 iOS 或是 HTML 程式碼生出來: 不過「刻 UI」的確是工程師最討厭的事情啦,這部份能自動化要怎麼說呢... 好像也是不錯的事情啦 @_@

Posted in Computer, Murmuring, Network, Programming, Software | Tagged , , , , , , , , , , , , , | Leave a comment

Reddit 在處理 Page View 的方式

Reddit 說明了他們如何處理 pageview:「View Counting at Reddit」。 以 Reddit 的規模有提到兩個重點,第一個在善用 Redis 的 HyperLogLog 這個資料結構,當量大的時候其實可以允許有微小的誤差: The amount of memory varies per implementation, but in the case of this implementation, we could count over 1 million IDs using just 12 kilobytes of space, … Continue reading

Posted in Cassandra, Computer, Database, Murmuring, Network, Programming, Service, Software | Tagged , , , , , , , , , , , , , , , , , , , | Leave a comment

GitHub Apps (前身 GitHub Integrations) 的 Rate Limiting 變得更彈性

GitHub 宣佈了把 GitHub Integrations 改名為 GitHub Apps,另外 Rate Limiting 變得更彈性:「GitHub Apps (formerly Integrations) General Release」。 All GitHub Apps start with a rate limit of 5000 requests per hour. To facilitate growth we have added a dynamic rate limit for installations: … Continue reading

Posted in Computer, Murmuring, Network, Programming, Service | Tagged , , , , , , | Leave a comment