Google 放出了九百萬張以 CC 授權釋出的圖片,標上 tag 後變成 Open Images dataset:「Introducing the Open Images Dataset」,像是這樣:

不過這不是人類分類出來的結果,而是機械學習的成果:
The image-level annotations have been populated automatically with a vision model similar to Google Cloud Vision API.
不過因為這不是人工確認過的資料,如果要拿來做比較精確的研究,還是得用 Amazon Mechanical Turk 這類服務先校正過以確保正確性。