"Том өгөгдөл" гэж юу вэ?

Яагаад энэ нь их чухал вэ?

"Том өгөгдөл" гэдэг нь их хэмжээний бүтцийн өгөгдлийг судлах замаар хүний ​​зан үйлийг ойлгож, урьдчилан таамаглах шинэ шинжлэх ухаан юм. Том өгөгдлийг "урьдчилан таамаглах аналитик" гэж нэрлэдэг.

Твиттер хуудсууд, Facebook feeds, eBay хайлтууд, GPS байршуулагч, АТМ машинууд нь зарим өгөгдлийн жишээ юм. Аюулгүй байдлын видео, замын хөдөлгөөний мэдээлэл, цаг уурын хэв маяг, нислэгийн дэргэдэх, гар утасны цамхагийн бүртгэл, зүрхний цохилт хянах төхөөрөмжийг судлах нь бусад хэлбэрүүд юм. Том өгөгдөл бол шинэлэг шинжлэх ухаан бөгөөд долоо хоног бүр өөрчлөгдөж байдаг бөгөөд цөөхөн хэдэн шинжээч үүнийг бүгдийг нь ойлгодог.

Том мэдээллийн зарим жишээнүүд нь жирийн амьдралд ямар байдаг вэ?

Дэлгэцийн зураг http://project.wnyc.org/transit-time

Ихэнх өгөгдлийн төсөл нь маш тодорхой бус боловч хувь хүмүүс, компаниуд, засгийн газруудын өдөр тутмын амьдралд нөлөөлж буй том хэмжээний өгөгдлийн амжилттай жишээ байдаг.

Вирусын дэгдэлтийг урьдчилан таамаглахад: нийгэм-улс төрийн мэдээлэл, цаг уур, цаг уурын мэдээ, эмнэлгийн / эмнэлзүйн мэдээллийг судлах замаар эдгээр эрдэмтэд 4 долоо хоногийн өмнө дэгдусийн халууралтын дэгдэлтийг урьдчилан таамаглаж байна.

Хомсдомын ажиглагч: Вашингтон хотод энэ том хэмжээний өгөгдлийн төслийн танилцуулга, хохирогчид, сэжигтэн, гэмт хэрэгтнүүдийг алсан хэрэг юм. Нас барагсдад хүндэтгэлтэй хандах, хүмүүст ойлгуулах эх сурвалж болохын хувьд энэ том өгөгдлийн төсөл нь гайхалтай юм.

Транзит Аялал Төлөвлөгөө, NYC: WNYC радио программчин Стив Мелендез нь онлайн метроны хуваарийг хосолсон аяллын програм хангамжаар нэгтгэсэн. Түүний бүтээлүүд нь Нью-Йоркт байрладаг газрын зургийг байрлуулах боломжийг олгодог бөгөөд галт тэрэг, метроны аялалын цагийг урьдчилан таамаглах болно.

Xerox ажиллах хүчнийхээ алдагдлыг бууруулсан: дуудлагын төвийн ажил нь сэтгэл хөдлөлийг бүрэн дүүрэн болгодог. Xerox мэргэжлийн шинжээчдийн тусламжтайгаар өгөгдлүүдийг судалж үзсэн бөгөөд одоогоор дуудлагын төвийн ажилчид нь хамгийн урт хугацаанд үлдэх магадлалтай байна.

Терроризмын эсрэг терроризмыг дэмжих: нийгмийн хэвлэл мэдээллийн хэрэгсэл, санхүүгийн бүртгэл, нислэгийн захиалга болон аюулгүй байдлын өгөгдлийг судлах замаар хууль сахиулах үйл ажиллагаа нь тэдний ёс бус үйлдлийг хийхээс өмнө террорист сэжигтнийг урьдчилан таамаглаж, олох боломжтой болно.

Олон нийтийн хэвлэл мэдээллийн сэтгүүл дээр суурилсан брэндийн маркетинг тохируулах нь хүмүүс хүмүүст онлайн бодолоо шуурхай, хурдан шуурхай хуваалцаж, pub, ресторан, эсвэл фитнесс клуб дээр хурдан солилцдог. Эдгээр сая сая хэвлэл мэдээллийн хэрэгслүүдийг судалж, хүмүүс өөрсдийн үйлчилгээг юу гэж үздэг талаар эргэцүүлэн бодох боломжтой.

Big Мэдээллийг хэн ашигладаг вэ? Тэдгээр нь юу хийдэг вэ?

Олон monolithic корпорациуд хэрэглэгчдийн сэтгэл ханамжийг дээд зэргээр нэмэгдүүлэхийн тулд их хэмжээний өгөгдлийг ашигладаг.

Яагаад ийм том өгөгдлүүд ийм том наймаа вэ?

4 зүйл том өгөгдөлийг чухал болгодог:

1. Өгөгдөл асар их байна. Энэ нь нэг хатуу диск , USB зөөгчийн хувьд таарахгүй. Өгөгдлийн хэмжээ нь хүний ​​оюун ухааныг мэдэрч чаддаг хэмжээнээс хамаагүй давсан (тэрбум тэрбум тэрбумыг бодоод үзээрэй).

2. Өгөгдөл нь эмх замбараагүй бөгөөд бүтэцлэгдээгүй. Том мэдээллийн ажлын 50% -аас 80% нь мэдээллийг хөрвүүлэх, цэвэрлэх нь эрэл хайгуул, ангилах боломжтой юм. Манай гариг ​​дээр хэдэн мянган мэргэжилтнүүд энэ өгөгдлийн цэвэрлэгээг хэрхэн хийх талаар бүрэн мэддэг. Эдгээр шинжээчид мөн HPE, Hadoop зэрэг маш нарийн мэргэжилтэй багаж хэрэгсэл хэрэгтэй. Магадгүй 10 жилийн дотор мэдээллийн томоохон мэргэжилтнүүд хэдэн арван доллар болж болох юм. Гэвч одоогоор тэд шинжээчдийн маш ховор зүйл байдаг бөгөөд тэдний ажил нь маш тодорхойгүй, төвөгтэй хэвээр байна.

3. Мэдээлэл нь худалдаалагдаж, худалдаж авч болох бараа бүтээгдэхүүн болж байна. Компани, хувь хүмүүс нийгмийн мэдээллийн хэрэгсэл болон бусад мэдээллийг терабийтэд худалдан авах боломжтой мэдээллийн зах зээл байдаг. Ихэнх өгөгдөл нь үүл дээр суурилсан бөгөөд аль ч хатуу дискэнд багтаахад хэтэрхий том байна. Өгөгдлийг худалдан авах нь ихэвчлэн үүл серверийн фермд залгаад захиалгын төлбөрийг хамардаг.

** Том өгөгдлийн хэрэгсэл, санаануудын удирдагчид нь Amazon, Google, Facebook, Yahoo юм. Эдгээр компаниуд нь олон сая хэрэглэгчдэд онлайн үйлчилгээ үзүүлдэг тул тэдгээрийн цуглуулах цэг, том хэмжээний анализийн цаана байгаа үзэгчид байх болно.

4. Том мэдээллийн боломжууд нь төгсгөлгүй байдаг. Магадгүй эмч нар нэг долоо хоногийн өмнө зүрхний шигдээс болон цус харвалтыг урьдчилан таамаглах болно. Агаарын болон авто осол нь механик өгөгдөл, хөдөлгөөн, цаг уурын хэв маягийн таамаглалаар буурч болно. Онлайн болзоонууд нь танд тохирох хувийн зан чанарыг том өгөгдөлтэй хүмүүсээр урьдчилан харах боломжтой. Хөгжимчид зорилтот үзэгчдийн өөрчлөгдөж буй амтыг хамгийн их таалсан хөгжмийн бүтэц нь юу болохыг ойлгох болно. Хоол тэжээлийн мэргэжилтнүүд дэлгүүрээс худалдаж авсан хоол хүнсний аль нэг хослолыг хүндрүүлэх, эсвэл хүний ​​эрүүл мэндийн нөхцөл байдлыг сайжруулахад урьдчилан таамаглах чадвартай байж болно. Гадаргуу нь зөвхөн тэмдэглэгээтэй байсан бөгөөд долоо хоног бүр их хэмжээний өгөгдлүүд илрэв.

Big Data Месси байна

Monty Rakusen / Getty

Том өгөгдөл нь урьдчилан таамагласан анализи: том хэмжээний бүтцийн өгөгдлийг хөрвөх боломжтой, ангилах боломжтой болгон хувиргах. Энэ бол өвөрмөц, эмх замбараагүй орон зай бөгөөд тусгай мэдлэг, тэвчээр шаарддаг.

Жишээ нь, цул UPS хүргэх үйлчилгээ авна уу. UPS-ийн программистууд жолоочийн GPS болон ухаалаг гар утасны судалгаануудаас замын хөдөлгөөний түгжрэлд дасан зохицох хамгийн үр дүнтэй аргуудыг судалж байна. Энэ GPS болон смартфоны өгөгдөл нь ихээхэн ач холбогдолтой бөгөөд шинжилгээнд автоматаар бэлэн биш байдаг. Энэ өгөгдөл нь янз бүрийн ухаалаг гар утасны төхөөрөмжийн тусламжтайгаар янз бүрийн GPS болон газрын зургийн мэдээллийн сангаас асгагддаг. UPS-ийн шинжээчид энэ бүх өгөгдлийг амархан хайж, эрэмбэлж болохуйц формат болгон хувиргадаг. Гэвч хүчин чармайлт нь үнэ цэнэтэй байсан. Өдгөө UPS 8 сая гаруй галлон түлш хэмнэжээ.

Том өгөгдөл нь эвгүй байдаг тул хэрэглээнд зориулан цэвэрлэж, бэлтгэх маш их хүчин чармайлт шаарддаг учраас өгөгдөл судлаачид өөрсдийн хийж байгаа бүх хөөмий ажилдаа зориулж 'өгөгдөл гаргагч' гэж нэрлэгддэг болсон. Gg

Том өгөгдөл, урьдчилан таамаглах аналитик шинжлэх ухаан нь долоо хоног бүр сайжирч байна. 2025 он гэхэд хүн бүрт хүртээмжтэй болохын тулд их хэмжээний өгөгдлөө хүлээнэ үү.

Big Мэдээлэл Нууцлалын Нууцыг хадгалах нь биш үү?

Feingersh / Getty нар

Тиймээ, хэрэв манай хууль, хувийн нууцлалын хамгаалалтыг сайтар удирддаггүй бол том хэмжээний мэдээлэл хувийн нууцад халддаг. Энэ нь Google, YouTube болон Facebook-ийн өдөр тутмын онлайн зуршилуудыг аль хэдийн хянаж байна . Таны ухаалаг гар утасны болон тооцоолох систем нь өдөр бүр дижитал тоонуудыг орхиж, нарийн төвөгтэй компаниуд эдгээр мөрүүдийг судалж байна.

Том хэмжээний өгөгдлүүдийн тухай хууль нь өөрчлөгдөж байна. Нууцлал бол одоо та хувийн хариуцлагаа хүлээхээ больсон учраас хувийн хариуцлагыг хүлээх ёстой гэсэн нөхцөл юм.

Таны хувийн нууцыг хамгаалахын тулд юу хийж болох вэ:

Хамгийн том алхам бол VPN сүлжээний холболтыг ашиглан өдөр тутам хийдэг зуршил юм. VPN үйлчилгээ таны сигналыг зогсоох болно. Ингэснээр таны байршлын онцлог, байршил нь наад зах нь нууцлалтай байдаг. Энэ нь таныг 100% үл мэдэгдэгч байх болно, гэхдээ VPN нь таны онлайн зуршилыг хэрхэн дагаж байгаагаа бодитоор бууруулах болно.

Том мэдээллийн талаар хаанаас мэдэж болох вэ?

Monty Raskusen / Getty

Том өгөгдөл нь аналитик оюун ухаантай, технологийн хувьд хайртай хүмүүст гайхалтай зүйл юм. Хэрэв тийм бол та сонирхолтой том өгөгдлийн төслүүдийн энэ хуудсанд зочилно уу.