Data mining гэж юу вэ?

Том компаниуд та нарын төсөөлж байснаас илүү ихийг мэддэг

Өгөгдлийн олборлолт гэдэг нь загвар, мэдлэгийг олж авахын тулд их хэмжээний өгөгдөлд дүн шинжилгээ хийх явдал юм. Үнэн хэрэгтээ, өгөгдлийн олборлолтыг мэдээлэл олж авах, мэдлэг олж авах гэж нэрлэдэг.

Өгөгдөл олборлох нь статистик, машин сурах (ML), хиймэл оюун ухаан (AI), ихээхэн хэмжээний өгөгдөл (өгөгдлийн сан, өгөгдлийн сангаас) ашигладаг.

Дата технологи юу хийдэг вэ?

Өгөгдлийн олборлолт нь хоёр үндсэн зорилттой: тайлбар ба таамаглал. Нэгдүгээрт, өгөгдлийн олборлолт нь өгөгдөл дэх хэв маягийг шинжлэхээс олж авсан мэдлэг, ойлголтыг тодорхойлдог. Хоёрдугаарт, өгөгдлийн олборлолт ирээдүйн хэв маягийг таамаглахын тулд хүлээн зөвшөөрөгдсөн өгөгдлийн хэв маягийн тодорхойлолтыг ашигладаг.

Жишээлбэл, та янз бүрийн ургамлын төрлийг хэрхэн таних тухай номнуудыг вэбсайт дээр үзэх цагийг өнгөрөөсөн бол тухайн вэбсайт дээрх үйл явдлын цаана ажиллаж буй мэдээллийн үйлчилгээ нь таны профайлтай холбоотой хайлтын тайлбарыг бүртгэдэг. Хоёр долоо хоногийн дараа нэвтэрч ороход вэбсайтын өгөгдлийн уул уурхайн үйлчилгээ нь өмнөх хайлтынхаа тодорхойлолтыг ашиглан таны одоогийн ашиг сонирхлыг урьдчилан таамаглах, ургамлыг таних талаархи номууд орсон худалдааны зөвлөмжүүдийг санал болгодог.

Өгөгдөл хэрхэн ажилладаг вэ?

Өгөгдөл боловсруулалт нь алгоритмийг ашиглан ажилладаг, компьютерийн өгөгдөл, өгөгдлийг хэрхэн яаж хийх, өгөгдөл доторхи янз бүрийн хэв маягийг олж илрүүлэх заавруудын багц юм. Өгөгдөл олборлоход ашигладаг өөр өөр загварын хүлээн зөвшөөрөх аргууд нь кластерийн шинжилгээ, алдааны илрүүлэлт, холболтын сургалт, өгөгдөл хамаарал, шийдвэрийн мод, регрессийн загвар, ангилал, гаднах илрүүлэлт болон мэдрэлийн сүлжээнд багтана.

Өгөгдөл уул уурхай нь янз бүрийн өгөгдлүүдэд загварыг урьдчилан таамаглах, урьдчилан таамаглахад ашиглаж болох хэдий ч ихэнх хүмүүс ихэнхдээ тэдгээрийг ойлгоогүй ч гэсэн худалдан авалт хийх сонголтууд болон зан төлөвийн загваруудыг ирээдүйн худалдан авалтыг урьдчилан таамаглахад ашиглах явдал юм шийдвэрүүд.

Жишээлбэл, та интернетэд байсан зүйлээ Facebook хэрхэн байнга мэдэж байгаа, танд зочилсон бусад вэбсайтуудтай холбоотой вэбсайтуудтай холбоотой мэдээллүүдийг хэрхэн харуулдаг вэ? Фэйсбүүк мэдээллийн уул уурхай нь таны хөтөч дээр хадгалагдсан мэдээллийг ашигладаг. Жишээ нь күүки гэх мэт үйл ажиллагаануудыг таны хайлтын системд ашигладаг. Facebook-ийн өмнөх хэрэглээнд тулгуурлан таны сонирхож буй бүтээгдэхүүн, таашаалыг урьдчилан таамаглах, ашиглах боломжтой болно.

Ямар тєрлийн єгєгдєл байж болох вэ?

Үйлчилгээ эсвэл дэлгүүрээс хамааран (физик дэлгүүрүүд өгөгдлийн олборлолтыг ашигладаг) танд болон таны хэв маягийн талаарх гайхалтай тоо мэдээллийг олборлож болно. Танай цуглуулсан мэдээлэл таны жолоодож буй тээврийн хэрэгсэл, таны амьдардаг газар, аялсан газар, захиалгат сэтгүүл, сонин, гэрлээгүй эсэх зэргээс бүрдэж болно. Түүнчлэн та хүүхэдтэй эсэх, хобби чинь юу вэ, аль хамтлагт дуртай, улс төрийн эрх мэдэл, онлайнаар худалдан авдаг, дэлгүүрээс худалдаж авдаг зүйл (ихэнхдээ харилцагчийнхаа шагнал урамшууллын картаар) Олон нийтийн мэдээллийн хэрэгсэл дээр таны амьдрал

Жишээ нь, өсвөр насны хүүхдүүдэд чиглэсэн жижиглэнгийн худалдаачид болон загварын хэвлэлүүд нь өсвөр үеийн худалдан авагчид, уншигчдад чиглэсэн загварын чиг хандлагыг урьдчилан таамаглахын тулд Instagram болон Facebook зэрэг нийгмийн мэдээллийн үйлчилгээнүүд дээр өгөгдөл олж авсан зургуудын мэдээллийг ашигладаг. Өгөгдөл олборлолтоор олж илрүүлсэн ойлголт нь зарим эмэгтэйчүүд жижиглэн худалдаалагчдын худалдан авах сонголтуудад маш тодорхой өөрчлөлтүүд дээр тулгуурлан эмэгтэй хүн жирэмсэн байх магадлалтай гэж урьдчилан таамаглаж болох юм. Жижиглэнгийн худалдаа эрхлэгч, Зорилго нь жирэмслэлтээс урьдчилан сэргийлэхийн тулд жирэмслэлтээс урьдчилан сэргийлэхийн тулд жирэмслэлтээс урьдчилан сэргийлэхийн тулд жирэмслэхээсээ өмнө хүүхдэд зориулсан бүтээгдэхүүний тасалбарыг залуу эмэгтэйд шуудангаар илгээсэн түүхийн загварт тулгуурлан жирэмслэлтийг урьдчилан таамаглахад маш зөв зүйтэй гэж мэдээлсэн.

Мэдээллийн ашиглалт хаа сайгүй байдаг хэдий ч бидний худалдан авалтын зуршил, хувийн сонголт, сонголт, санхүүжилт, онлайн үйл ажиллагааны талаар олж мэдсэн мэдээллүүдийн ихэнх нь хэрэглэгчийн туршлагыг сайжруулах зорилгоор дэлгүүр, үйлчилгээг ашигладаг.