گراف کاوی یا پردازش گراف چیست؟
گراف کاوی مجموعه ای از ابزارها و تکنیک های مورد استفاده برای (الف) تجزیه و تحلیل ویژگی های نمودارهای دنیای واقعی، (ب) پیش بینی چگونگی تأثیر ساختار و ویژگی های یک نمودار معین بر برخی کاربردها، و (ج) توسعه مدل هایی است که توانایی تولید دارند. این ویژگی در هوش مصنوعی کاربرد فرآوانی دارد.
این نمودار ها، نمودارهای واقع گرایانه هستند که با الگوهای موجود در نمودارهای مورد علاقه دنیای واقعی مطابقت دارند.
وظیفه گراف کاوی استخراج الگوها (گراف های فرعی) مورد علاقه از نمودارها است که داده های اساسی را توصیف می کنند و می توانند بیشتر مورد استفاده قرار گیرند، به عنوان مثال، برای طبقه بندی یا خوشه بندی.
دریافت اطلاعات بصری
با کمک این تکنیک می توانید داده ها را یه صورت بصری و معنی دار در دسترس داشته باشید.
پیشبینی اطلاعات
با استفاده از تکنیک های گراف کاوی می توانید داده های آینده را پیشبینی کنید
طبقه بندی اطلاعات
با استفاده از گراف کاوی می توانید اطلاعاتی را که به دست می آورید به راحتی مورد استقاده قرار دهید.
خوشه بندی اطلاعات
خوشه بندی اطلاعات به دست آمده از فناوری گراف کاوی اطلاعات کلی را به شما نمایش می دهد.
درک طبقه بندی نمودار یا گراف کاوی
طبقهبندی نمودار، نمودارهایی را در میان حجم وسیعی از دادههای متصل (به عنوان مثال: اجتماعی، بیولوژیکی و پرداخت) تولید میکند و از نمودارها برای شناسایی برچسبها (با نظارت) یا خوشهها (بدون نظارت) استفاده میکند.
اگر این برای شما سخت به نظر می رسد، نمی توانید بیشتر از مغز خود نگاه کنید زیرا در استنتاج سریع اتصالات بین نمودارها استاد است.
به عنوان مثال، مغز شما می داند که چگونه بدون حتی فکر کردن از نقطه A به نقطه B برسد. آخرین سفر خواربارفروشی خود را پس از مدتها انجام وظیفه خرید تصور کنید. میتوانید کاتالوگها را مرور کنید و خطوط متعددی را در دستههای مختلف راهروها ایجاد کنید تا در حین آوردن فرزندانتان به خرید، محصولات را با هم مقایسه کنید.
همه این اقدامات برای استنباط بهترین اقدام بر اساس یک سری اقدامات فرعی برای رسیدن به هدف نهایی شما نیاز به ادغام دارند. همه این کارها در بی دردسرترین روش ممکن انجام می شود.
به همین ترتیب…
استخراج نمودار از ویژگیهایی استفاده میکند تا ببیند چگونه مجموعهای از مشاهدات از یک کاربر که با سیگنال شباهت مواجه است، مرتبط است.
نمودارها روابط (لبه ها) بین موجودیت ها (گره ها) را نشان می دهند که بر اساس فاصله فرموله می شوند.
معمولاً دو ویژگی وجود دارد:
نمودارهای طبیعی که از یک منبع خارجی می آیند. به عنوان مثال شبکه های پرداخت، رسانه های اجتماعی و جاده ها.
نمودارهای شباهت که از اندازه گیری فاصله شباهت بین گره ها حاصل می شود. به عنوان مثال یک لکه از ابرداده سپس ساختار لکه را از طریق نمایش نمودار به اشتراک می گذارد.
بسته به ویژگی های نمودارها، می توانیم هر نمودار را به عنوان طبقه بندی کنیم
- همگن ساده با یک نوع گره و لبه
ناهمگن پیچیده با انواع متعدد گره، انواع لبه های متعدد. اینها می توانند جهت دار یا غیر جهت دار باشند.چرا گراف ها مهم هستند؟
نمودارها همه جا هستند
نمودارها چند منظوره هستند. میتوانید مدلهای نظارتشده را با طبقهبندی همسایگان اطراف، مدلهای نیمهنظارتشده با انتشار برچسبهای موجود به برچسبهای گمشده در همسایگی، و مدلهای بدون نظارت با آموزش تعبیههای سطح گره برای توصیف نقش ساختاری دادهها بسازید.
طیف گسترده ای از وظایف وجود دارد که می توانید با نمودارها انجام دهید. به عنوان مثال، می توانید گره ها، نمودارها و پیوندها را بسته به مورد استفاده خود طبقه بندی کنید.
این موارد شامل پیشرفتهای متعددی مانند: نمودار بخشهای فوقالعاده Google DeepMind برای پیشبینی زمان ورود (ETA) و PinSage از Pinterest است.
نمودارها مفاهیم انتزاعی را با روابط و هویت محاسبه می کنند
نمودارها اطلاعات محلی را انتزاع می کنند و اطلاعات مفید جهانی را از داده ها استخراج می کنند. ساختار/توپولوژی نمودار می تواند چیزهای زیادی در مورد داده های ما به ما بگوید، مانند کشف خوشه هایی از نقاط داده، یا ارائه معیارهای فاصله برای مفاهیم غیر قابل لمس.
نمودارها انواع داده ها قابل انعطاف هستند
نمودارها با تعبیه و ترکیب انواع مختلفی از ویژگیها مانند: متنی (مانند شباهت ژاکارد)، بصری (مانند شباهتهای تصویر)، و سایر ویژگیهای معنایی، انعطافپذیر عمل میکنند. به عنوان مثال، زمانی که تحلیلگران بر روی شناسایی قوانین کمپین کار می کنند، از چندین ویژگی مانند شباهت بین تنظیمات regex استفاده می کنند و regex را برای گرفتن این سایت ها به کار می برند.
نمودارها مقیاس پذیر هستند
Graph Sampling برای جستجوی زیرگراف ها در زمینه های پذیرنده استفاده می شود. این زیرگراف ها را می توان در بالای توزیع های همگام کارگران فرموله کرد: سرورهای اختصاصی برای واکشی پارامترهای مدل.
این مقیاس پذیری همچنین راه هایی را برای استفاده از یادگیری فدرال در نمودارها برای حفظ حریم خصوصی کاربران (مانند آموزش ML مبتنی بر اندروید) ارائه می دهد.