گراف کاوی چیست؟

گراف کاوی یا پردازش گراف چیست؟

گراف کاوی مجموعه ای از ابزارها و تکنیک های مورد استفاده برای (الف) تجزیه و تحلیل ویژگی های نمودارهای دنیای واقعی، (ب) پیش بینی چگونگی تأثیر ساختار و ویژگی های یک نمودار معین بر برخی کاربردها، و (ج) توسعه مدل هایی است که توانایی تولید دارند. این ویژگی در هوش مصنوعی کاربرد فرآوانی دارد.

این نمودار ها، نمودارهای واقع گرایانه هستند که با الگوهای موجود در نمودارهای مورد علاقه دنیای واقعی مطابقت دارند.

وظیفه گراف کاوی استخراج الگوها (گراف های فرعی) مورد علاقه از نمودارها است که داده های اساسی را توصیف می کنند و می توانند بیشتر مورد استفاده قرار گیرند، به عنوان مثال، برای طبقه بندی یا خوشه بندی.

گراف کاوی

دریافت اطلاعات بصری

با کمک این تکنیک می توانید داده ها را یه صورت بصری و معنی دار در دسترس داشته باشید.

گراف کاوی

پیشبینی اطلاعات

با استفاده از تکنیک های گراف کاوی می توانید داده های آینده را پیشبینی کنید

گراف کاوی

طبقه بندی اطلاعات

با استفاده از گراف کاوی می توانید اطلاعاتی را که به دست می آورید به راحتی مورد استقاده قرار دهید.

گراف کاوی

خوشه بندی اطلاعات

خوشه بندی اطلاعات به دست آمده از فناوری گراف کاوی اطلاعات کلی را به شما نمایش می دهد.

مطالعه بیشتر

درک طبقه بندی نمودار یا گراف کاوی

طبقه‌بندی نمودار، نمودارهایی را در میان حجم وسیعی از داده‌های متصل (به عنوان مثال: اجتماعی، بیولوژیکی و پرداخت) تولید می‌کند و از نمودارها برای شناسایی برچسب‌ها (با نظارت) یا خوشه‌ها (بدون نظارت) استفاده می‌کند.

اگر این برای شما سخت به نظر می رسد، نمی توانید بیشتر از مغز خود نگاه کنید زیرا در استنتاج سریع اتصالات بین نمودارها استاد است.

به عنوان مثال، مغز شما می داند که چگونه بدون حتی فکر کردن از نقطه A به نقطه B برسد. آخرین سفر خواربارفروشی خود را پس از مدتها انجام وظیفه خرید تصور کنید. می‌توانید کاتالوگ‌ها را مرور کنید و خطوط متعددی را در دسته‌های مختلف راهروها ایجاد کنید تا در حین آوردن فرزندانتان به خرید، محصولات را با هم مقایسه کنید.

همه این اقدامات برای استنباط بهترین اقدام بر اساس یک سری اقدامات فرعی برای رسیدن به هدف نهایی شما نیاز به ادغام دارند. همه این کارها در بی دردسرترین روش ممکن انجام می شود.

به همین ترتیب…
استخراج نمودار از ویژگی‌هایی استفاده می‌کند تا ببیند چگونه مجموعه‌ای از مشاهدات از یک کاربر که با سیگنال شباهت مواجه است، مرتبط است.

نمودارها روابط (لبه ها) بین موجودیت ها (گره ها) را نشان می دهند که بر اساس فاصله فرموله می شوند.

معمولاً دو ویژگی وجود دارد:

نمودارهای طبیعی که از یک منبع خارجی می آیند. به عنوان مثال شبکه های پرداخت، رسانه های اجتماعی و جاده ها.
نمودارهای شباهت که از اندازه گیری فاصله شباهت بین گره ها حاصل می شود. به عنوان مثال یک لکه از ابرداده سپس ساختار لکه را از طریق نمایش نمودار به اشتراک می گذارد.
بسته به ویژگی های نمودارها، می توانیم هر نمودار را به عنوان طبقه بندی کنیم

  • همگن ساده با یک نوع گره و لبه
    ناهمگن پیچیده با انواع متعدد گره، انواع لبه های متعدد. اینها می توانند جهت دار یا غیر جهت دار باشند.

    چرا گراف ها مهم هستند؟

نمودارها همه جا هستند

نمودارها چند منظوره هستند. می‌توانید مدل‌های نظارت‌شده را با طبقه‌بندی همسایگان اطراف، مدل‌های نیمه‌نظارت‌شده با انتشار برچسب‌های موجود به برچسب‌های گمشده در همسایگی، و مدل‌های بدون نظارت با آموزش تعبیه‌های سطح گره برای توصیف نقش ساختاری داده‌ها بسازید.

طیف گسترده ای از وظایف وجود دارد که می توانید با نمودارها انجام دهید. به عنوان مثال، می توانید گره ها، نمودارها و پیوندها را بسته به مورد استفاده خود طبقه بندی کنید.

این موارد شامل پیشرفت‌های متعددی مانند: نمودار بخش‌های فوق‌العاده Google DeepMind برای پیش‌بینی زمان ورود (ETA) و PinSage از Pinterest است.

نمودارها مفاهیم انتزاعی را با روابط و هویت محاسبه می کنند

نمودارها اطلاعات محلی را انتزاع می کنند و اطلاعات مفید جهانی را از داده ها استخراج می کنند. ساختار/توپولوژی نمودار می تواند چیزهای زیادی در مورد داده های ما به ما بگوید، مانند کشف خوشه هایی از نقاط داده، یا ارائه معیارهای فاصله برای مفاهیم غیر قابل لمس.

نمودارها انواع داده ها قابل انعطاف هستند

نمودارها با تعبیه و ترکیب انواع مختلفی از ویژگی‌ها مانند: متنی (مانند شباهت ژاکارد)، بصری (مانند شباهت‌های تصویر)، و سایر ویژگی‌های معنایی، انعطاف‌پذیر عمل می‌کنند. به عنوان مثال، زمانی که تحلیلگران بر روی شناسایی قوانین کمپین کار می کنند، از چندین ویژگی مانند شباهت بین تنظیمات regex استفاده می کنند و regex را برای گرفتن این سایت ها به کار می برند.

نمودارها مقیاس پذیر هستند

Graph Sampling برای جستجوی زیرگراف ها در زمینه های پذیرنده استفاده می شود. این زیرگراف ها را می توان در بالای توزیع های همگام کارگران فرموله کرد: سرورهای اختصاصی برای واکشی پارامترهای مدل.

این مقیاس پذیری همچنین راه هایی را برای استفاده از یادگیری فدرال در نمودارها برای حفظ حریم خصوصی کاربران (مانند آموزش ML مبتنی بر اندروید) ارائه می دهد.