Recent Comments
Archives
- May 2012 (8)
- April 2012 (11)
- March 2012 (10)
- February 2012 (11)
- January 2012 (5)
- December 2011 (13)
- November 2011 (12)
- October 2011 (10)
- September 2011 (7)
- August 2011 (5)
- July 2011 (11)
- June 2011 (21)
- May 2011 (22)
- April 2011 (36)
- March 2011 (43)
- February 2011 (23)
- January 2011 (24)
- December 2010 (34)
- November 2010 (19)
- October 2010 (16)
- September 2010 (15)
- August 2010 (10)
- July 2010 (12)
- June 2010 (3)
- May 2010 (3)
- April 2010 (4)
- March 2010 (8)
- February 2010 (14)
- January 2010 (13)
- December 2009 (16)
- November 2009 (28)
- October 2009 (24)
- September 2009 (12)
- August 2009 (7)
- July 2009 (10)
- June 2009 (11)
- May 2009 (22)
- April 2009 (21)
- March 2009 (18)
- February 2009 (7)
- January 2009 (32)
- December 2008 (19)
- November 2008 (12)
- October 2008 (15)
- September 2008 (14)
- August 2008 (15)
- July 2008 (18)
- June 2008 (20)
- May 2008 (19)
- April 2008 (27)
- March 2008 (22)
- February 2008 (21)
- January 2008 (15)
- December 2007 (22)
- November 2007 (17)
- October 2007 (29)
- September 2007 (31)
- August 2007 (34)
- July 2007 (31)
- June 2007 (36)
- May 2007 (23)
- April 2007 (22)
- March 2007 (30)
- February 2007 (50)
- January 2007 (75)
- December 2006 (48)
- November 2006 (59)
- October 2006 (89)
- September 2006 (29)
- August 2006 (48)
- July 2006 (14)
- June 2006 (35)
- May 2006 (62)
- April 2006 (63)
- March 2006 (72)
- February 2006 (83)
- January 2006 (56)
- December 2005 (46)
- November 2005 (60)
- October 2005 (27)
- September 2005 (54)
- August 2005 (83)
Tags
amazon android api aws bittorrent browser cdn certificate chrome cloud cloudfront cpan database dns ec2 facebook firefox freebsd google hosting html https ie image ipv6 javascript jquery js linux mobile mozilla mysql p2p performance perl php secure security ssl twitter ubuntu video web wordpress yahooCategories
- Anime (25)
- AWS (51)
- BBS (17)
- Blog (201)
- Book (18)
- Bridge (1)
- Browser (283)
- CDN (21)
- Cloud (66)
- CMS (33)
- Comic (17)
- Computer (1980)
- Computer and Network Center (32)
- CSS (31)
- Database (132)
- DNS (50)
- Editor (11)
- Financial (37)
- Firefox (149)
- Food (11)
- FreeBSD (115)
- Game (25)
- GoogleChrome (25)
- Hardware (144)
- IE (64)
- Joke (131)
- Lab (3)
- Linux (72)
- MacOS (4)
- Mail (69)
- Movie (18)
- Murmuring (2056)
- Music (37)
- MySQL (97)
- NCTU (63)
- NetBSD (7)
- Network (1486)
- OpenBSD (3)
- Opera (21)
- OS (205)
- P2P (86)
- Photo (57)
- Political (48)
- Programming (315)
- Recreation (372)
- RSS (65)
- Safari (22)
- Science (28)
- Search Engine (126)
- Security (336)
- SMS (5)
- Social (60)
- Software (1062)
- Spam (86)
- Sport (4)
- Telephone (62)
- Television (35)
- Usenet (13)
- Vim (3)
- Wiki (25)
- Windows (48)
- WWW (782)
Blogroll
Meta
Category Archives: Search Engine
PIXNET 換網址後的 PageRank 情況
照慣例還是得先說明,我從去年八月 (還是九月?) 開始就是 PIXNET 的員工,負責處理各種雜事。(不過不包括換燈管,那不是我的工作) 另外說明,我對 Gene 的 OO 沒有信心,所以請不要跟我討論 Gene 為什麼不用 oo 方法或是 xx 方法,我知道 Gene 都知道這些方法,但是這會擋人財路所以不能做 (不要忘記他跟 BloggerAds 的關係)。 下面是星期五在公司發生的鳥事情… 星期五下午被 far 叫進辦公室,與其他同事討論換網址後「部落格觀察」不更新網址造成的影響,有很多 Blogger 很在乎這個分數。討論時覺得奇怪,不是已經換很久了嗎,怎麼又突然拿出來討論?回到家發現原來是「這次 PageRank 變動表現出無名的跌落? 」以及「在 9 月底的 PageRank 變動 (新的 PR6 部落格)」這兩篇文章故意捅 PIXNET 兩刀造成的。 這兩篇文章的敘述故意給人印象「PIXNET … Continue reading
Posted in Computer, Murmuring, Network, Search Engine, WWW 12 Comments
Yuil
Update:這個站倒了 XD 只剩下 screenshot 可以看了… 這個實在太讚了 XD 從 Google Blogoscoped 看到「Yuil」這篇,有人用 Google App Engine,拿 Yahoo! Search BOSS 的結果,與 Cuil 的介面的 Mashup !!! 我覺得搜尋的結果比 Cuil 準多了啊 XD
Posted in Computer, Joke, Murmuring, Network, Recreation, Search Engine, WWW 1 Comment
Google Video Search 的發展
Google 拿美國總統大選的影片,透過語音辨識轉成文字後讓大家搜尋:Google Lets You Search for Text in Some Videos。 如同 Philipp Lenssen 所說的,如果 Google 把這個技術推廣到所有的影片上,就有很多可行性可以做,像是與 Google AdSense 的配合、與 Google Search Quality 的配合。 比起直接對影像處理,對聲音處理似乎是條可以走的路… (就目前的語音辨識)
Posted in Computer, Murmuring, Recreation, Search Engine, Television Leave a comment
OSDC.TW 2008 第一天
OSDC.TW 2008 第一天我是中午才到的。在技術方面,大多數的題目都已經在網路上看過資料研究過,沒有什麼特別的感想,不過可以感覺到有些講者可能因為經驗與時間的關係,有些重要的地方都沒講清楚。 先是我們自己家介紹的 Berkeley DB,jnlin 沒有提到為何要避免使用 LEFT JOIN 的原因,然後在測試的部份數據也少說明了很多東西。 另外 Vivek Ratan 講 Hadoop 的部份,有些地方沒有講清楚,像是要怎麼因應 Namenode 故障時的處理 (在「Metadata Disk Failure」這邊的說明可以參考)。另外我回來查了以後發現跑 Hadoop 後,所需要的時間變成原來的 66%,而不是效率變成原來的 66%,所以我在台下問了一個笨問題… 第一天結束後倒是到樓下的咖啡廳聊了很久,儘講些有的沒的…
Posted in Computer, Database, Murmuring, Network, Search Engine, Software Leave a comment
部落格觀察
都是小圖,看不清楚的可以點回 Flickr 的頁面看到大圖。 我不曉得依照這個規則是怎麼算出比彎彎還要高分:(原出處:部落格觀察貼紙各式說明) 下面這張是依照「Page 總分」排序,彎彎在第九名,第七名是 Gene,第八名是 Wildcat,第十三名是 askareiko,剛好是部落格觀察的「GAW」,這個「排行榜」的公信力大家自己心中應該有數。
Posted in Blog, Computer, Murmuring, Network, Search Engine, Spam, WWW 7 Comments
在 Gmail 裡列出中文的信
依照 Search Emails by Language in Gmail 的說法,在搜尋條件的地方輸入「language:Chinese」應該會出現中文的郵件,不過實際上只有簡體中文… 總之我跑到 Gmail Help Discussion 上問,看看是不是 bug 或是 “feature”:Search condition “language:chinese” not function very well。
Posted in Computer, Mail, Murmuring, Network, Search Engine, WWW 3 Comments
Google 翻譯機翻新
Google 新的翻譯引擎終於上線了:Google’s New Translations。 李開復在交大時就有提到以網頁的文字提昇翻譯的品質,當時他是以中文作為說明的背景,說明當 Google 網頁所儲存的量愈來愈大的時候,翻譯的準確度會愈來愈高,現在終於看到這個理論的產品上線了。 不過還是有蠻多好笑 (而且奇怪 XD) 的翻譯…
Social Network Search in Taiwan
事先說明:我是 Pixnet 的技術顧問,在這篇文章裡提到的這項服務與 Pixnet 以及 Pixnet 競爭對手有關。 網址:http://sn.hasname.com/。 前陣子看到「玩WARM人脈搜尋網 竟抓到劈腿男」這篇文章後,我第一個想法是「這個東西也能當研究?」,如果連這種幹壞事的事情都要教授指導才能研究的話… (後面三千字省略) 我在思考了一下整個架構後,似乎沒有技術上的問題,至於 Similiarity (好友相似度) 的部份,在 IRC 上跟 lwhsu 討論過後也已經知道方向在哪裡,就跳下去寫,看看要寫多久。Social Network Search in Taiwan 這個網站就是這樣的產物。 目前只做了無名小站的部份 (先跑一陣子看看),未來希望能再加上其他站台。另外有打算直接開放 API (預定是 JSON 與 SOAP) 以及 feed (應該還是會用 RSS 2.0)。 以下補充一些題外話。 以我個人的習慣,系統當然還是 FreeBSD + … Continue reading
Posted in Blog, Computer, Murmuring, Network, Search Engine, WWW 12 Comments
Google 關燈計畫
呃… 這個關燈是真的關燈。 在舊金山地區的人如果連上 Google 首頁 看到像這樣的樣子,請不要以為是 Google 被入侵或是四月一號到了,這是 Google 的 Lights Out San Francisco 計畫: 這個計畫希望舊金山地區的使用者在星期六當地的晚上八點到九點把電燈關掉。
Posted in Computer, Murmuring, Search Engine, WWW 3 Comments
無名小站的 robots.txt
事先說明:我是 Pixnet 的技術顧問。 補一些 Yahoo! + 無名小站 濫用市場地位、排除其他搜尋引擎 ? 這篇的內容。依照 HTTP header 所寫,robots.txt 最後修改日期是 8/23: Last-Modified: Thu, 23 Aug 2007 07:33:09 GMT 另外在 Google Blog Search 則是從 9/21 停止 index:Google 網誌搜尋:site:www.wretch.cc。 本來想找 Wayback Machine,結果發現 robots.txt 的資料也已經消失了,暫時想不到有什麼其他的服務有保留。
Posted in Blog, Computer, Murmuring, Network, Search Engine 3 Comments
