E-Siber.com
teknoloji haberinin
değil, bilgisinin
peşinde...
   
Sitede şu an 1544 yazı bulunmaktadır.

Son Yorumlar

5 Milyar Web Sayfasının Tarandığı Ortak Dizin

Common Crawl, 5 milyardan fazla web sayfasını, PageRank değerleri, bağlantı (link) grafikleri ve diğer meta verileriyle birlikte serbestçe erişilebilir bir dizin (indeks) halinde tamamen ücretsiz olarak sunan açık-kaynak bir ortak tarama veri tabanıdır.

 

Herkesin kullanımına açık olan Common Crawl, web ölçeğinde, milyarlarca doküman ve siteden oluşan bir ortak indekstir. Amazon EC2/S3 bulutunda API'ler aracılığı ile erişimin mümkün kılındığı devasa web indeksi onlarca terabyte ebatında veriyi araştırmacıların, arama motorlarının, kurumların, sitelerin ve bireylerin kullanımına ücretsiz olarak sunuyor.

 

 

Aslında bağımsız bir vakıf teşebbüsü olarak ortaya çıkan Common Crawl Vakfı, yenilik, eğitim ve araştırma için yeni bir dalga ve Google'ın kontrolünde olmayan bir veri kümesi oluşturmak gayesiyle 3 yıl önce kuruldu. Bilgiyi filtrelemeden ve tamamen ücretsiz olarak sunan Common Crawl belki de açık web inisiyatifinin en çarpıcı örneklerinden biridir.

 

Adres: http://www.commoncrawl.org


· · · · · · · · · · · · · · ·
Yazan: | 09.11.2011 | 690 kez okundu.

 


WEB SİTELERİ

Yukarı Çık

© 2012 E-SİBER BİLGİ-İLETİŞİM TEKNOLOJİLERİ | Hakkımızda
Bilişim | İnternet | Bilgi Güvenliği | Sosyal Medya | Teknoloji | M. Mekin Pesen
Adresler: E-Siber.com | E-Siber.net | ESiber.com | RSS | Facebook | Twitter | Abone Olun
IP: 38.107.179.216 | Süre: 0.532 saniye. | İletişim | Reklam Verin | Politikalar | İstatistikler