مطالب مرتبط با کلیدواژه

داده کاوی


۲۰۱.

نقش ابزارهای هوش کسب و کار در فرآیند تصمیم سازی در شرکت های سرمایه گذاری تامین اجتماعی شهر تهران

کلیدواژه‌ها: فرآیند تصمیم گیری هوش تجاری داده کاوی انبار داده

حوزه‌های تخصصی:
تعداد بازدید : ۲۱۹ تعداد دانلود : ۲۱۹
از جمله عواملی که می تواند نقش مهمی در فرایند تصمیم گیری ایفا کند استفاده از ابزارهای هوش تجاری می باشد و مشاوران بازاریابی جهانی به استفاده از ابزارهای جدید هوش تجاری و تمرکز بر اهمیت این ابزارها تاکید داشته اند. در همین راستا در این پژوهش نقش ابزارهای هوش تجاری بر فرایند تصمیم گیری مورد بررسی قرار گرفت. در این پژوهش نمونه آماری شامل مدیران و روسای بخش های مختلف شرکت سرمایه گذاری تامین اجتماعی شهر تهران است. این پژوهش از نظر هدف کاربردی بوده و از نظر روش توصیفی می باشد. داده های مورد نیاز برای این پژوهش، بوسیله یک پرسشنامه استاندارد که پایایی و روایی آن مجددا مورد بررسی و تائید قرار گرفت، جمع آوری شد. همچنین برای نگارش ادبیات نظری لازم در حوزه مورد بررسی از مطالعات کتابخانه ای نیز بهره گرفته شد. در این پژوهش از دو روش مختلف برای ارزیابی استفاده شد. در مرحله اول از روش دیمتل برای ارزیابی اولیه متغییرها و شاخص ها و ارزیابی و استخراج متغییرها و شاخص های تاثیرگذار و تاثیر پذیر استفاده شد که ابزار گرداوری داده های آن از طریق مصاحبه انجام پذیرفت و در مرحله دوم از روش تحلیل آماری استفاده گردید که برای انجام آن از آمار استنباطی و توصیفی استفاده می شود. در بخش آمار استنباطی ازضریب همبستگی پیرسون با استفاده از نرم افزار SPSS بهره گرفته شد. به طور کلی، نتایج این پژوهش حاکی از نقش استفاده از ابزارهای هوش تجاری بر فرایند تصمیم گیری بود و نشان داد که سیستم هوش تجاری و این ابزارها رابطه نزدیکی با فرایند تصمیم گیری دارند. در تبیین این نقش می توان گفت که اتخاذ تصمیم با پشتیبانی سیستم های هوش تجاری، زمان، هزینه و خطای انسانی را کاهش می دهد. به عبارتی، سیستم های هوش تجاری یک جهانی سازی فنی در جهان بازار است که با استفاده از آن، فرایندی تصمیم گیری در سازمان اثربخش شده و با کاهش اتلاف وقت و خطرات و ابهام در کار، توانایی مقابله با تغییرات گسترده در سطح جهانی را به سازمان می دهد.
۲۰۲.

تحلیل مشتریان رویگردان از بانک و خوشه بندی سایر مشتریان بر اساس میزان شباهت با مشتریان رویگردان

کلیدواژه‌ها: داده کاوی رگرسیون خطی ضریب همبستگی خوشه بندی

حوزه‌های تخصصی:
تعداد بازدید : ۲۵۸ تعداد دانلود : ۱۵۵
در نظام بانکی که چرخه ورود و خروج وجوه نقد در قالب سپرده پذیری و پرداخت تسهیلات اصلی ترین فعالیت آن محسوب می شود، حفظ مشتریان اهمیت بالایی دارد. بدین منظور مدیران بانک ها بصورت قابل توجهی به حوزه امور مشتریان تمرکز نموده و در این راستا داده کاوی و روش های تحلیل متنوع آماری می تواند نقش موثری در تصمیم گیری داشته باشد. در این پژوهش روشی پیشنهاد خواهد شد که در آن از یک الگوریتم مبتنی بر ضریب همبستگی، شاخص های موثر بر مشتریانی که اخیرا از بانک خارج شده اند، را شناسایی خواهد نمود و سپس با استفاده از قابلیت رگرسیون خطی، مدل خروج مشتریان استخراج و نهایتا متناسب با شباهت مشتریان با مدل رگرسیون، مشتریان در 6 خوشه طبقه بندی خواهند شد. در همین راستا تحلیل هایی درخصوص سایر شاخص ها و انتظارات مدیریتی برای تمرکز و حفظ مشتریان ارائه شده است.
۲۰۳.

کاربرد داده کاوی در بهبود فرایندهای مالیاتی: مرور ادبیات سیستماتیک و دسته بندی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: داده کاوی رده بندی و پیش بینی فرایند مالیاتی مالیات

حوزه‌های تخصصی:
تعداد بازدید : ۴۳۶ تعداد دانلود : ۲۶۱
هدف: با توجه به اهمیت استخراج دانش مفید از داده های مالیاتی و نقش مؤثر داده کاوی در این زمینه، هدف این پژوهش، مرور ادبیات جامع و نظام مند و ارائه گزارشی از وضعیت تحقیقات حوزه داده کاوی و مالیات، دسته بندی پژوهش های انجام شده و معرفی شکاف های تحقیقاتی و ارائه نقشه راهی برای محققان و علاقه مندان در این زمینه است. روش: جامعه آماری پژوهش، تحقیقات انجام شده در زمینه داده کاوی و مالیات، طی سال های 2000 تا 2021 بوده است. با مرور ادبیات جامع و نظام مندِ تحقیقات، از دیدگاه فرایندی، 4 فرایند و از دیدگاه حوزه های کاربردی مختلف، 7 زمینه مطالعه و بررسی شد. دسته بندی تحقیقات بر اساس چارچوب پیشنهادی انجام گرفت و تحلیل های مختلفی از منظر فرایندها، حوزه های کاربردی و روش های داده کاوی ارائه شد. یافته ها: نتایج این تحقیق نشان می دهد که فرایند بازرسی (آزمون) و حوزه کاربردی «انتخاب مبتنی بر ریسک برای حسابرسی مالیاتی» بیشترین حجم از تحقیقات را به خود اختصاص داده اند. محبوب ترین و پرکاربردترین تکنیک استفاده شده، «رده بندی و پیش بینی» بوده و الگوریتم های شبکه عصبی، درخت تصمیم و ماشین بردار پشتیبان نیز به ترتیب بیشترین کاربرد را داشته اند. نتیجه گیری: در زمینه های کاربردی هفت گانه، پتانسیل خوبی برای پیاده سازی تکنیک های داده کاوی وجود دارد. رویکردهای مبتنی بر یادگیری انتقالی، یادگیری عمیق، تحلیل گراف و تحلیل کلان داده برای تحقیقات آتی پیشنهاد می شود. ارائه چارچوب های کاربردی بومی سازی شده برای سیستم ها و اداره های امور مالیاتی کشورهای مختلف و یکپارچه سازی منابع داده داخلی و خارجی اداره های امور مالیاتی و تحلیل آن، از خلأهای اصلی این حوزه است که می تواند اثربخشی ویژه ای ایجاد کند.
۲۰۴.

باز طراحی مدل فرآیند خدمات مددکاری و توانمندسازی با استفاده از تکنیک های داده کاوی و فرآیندکاوی (مطالعه موردی: کمیته امداد امام خمینی استان آذربایجان غربی)(مقاله پژوهشی دانشگاه آزاد)

کلیدواژه‌ها: خدمات مددکاری توانمندسازی داده کاوی فرایندکاوی کمیته امداد

حوزه‌های تخصصی:
تعداد بازدید : ۲۳۰ تعداد دانلود : ۲۶۹
این پژوهش به بررسی میزان موفقیت مدل پیاده سازی شده فرایند خدمات مددکاری و توانمندسازی در بزرگترین نهاد حمایتی کشور پرداخته و با بهره گیری از تکنیک های نوین، نسبت به بازطراحی مدل اولیه اقدام نموده است. در این تحقیق داده های مربوط به منظور سنجش میزان تحقق اهداف کاربردی با توزیع پرسش نامه در بین 100نفر از همکاران کمیته امداد در سطح 21 شهرستان استان آذربایجان غربی جمع آوری و با استفاده از متدولوژی CRISP-DM مراحل مختلف مبتنی بر داده کاوی انجام گردید. در ادامه به منظور پاسخگویی به سوال اصلی تحقیق، داده های مربوط به تعداد4687مددجویی که فرایند موجود را طی نموده بودند از طریق تکنیک های فرایندکاوی مورد بررسی قرار گرفت.نتایج حاصل نشان داد که مدل پیاده سازی شده، معیارهای 4 گانه کیفی را از جنبه سادگی محقق، ولی به منظور دستیابی کامل به مطابقت، عمومیت و دقت، نیاز به بازطراحی دارد. در این راستا با حذف حلقه تکرار در مسیر ۳،  مدل اولیه بازطراحی گردید تا ضمن تحقق کامل اهداف کاربردی، با مد نظر قرار دادن مطالبات اقشار آسیب پذیر اجتماعی،ضمن تکریم و افزایش سطح رضایت مندی جامعه هدف، به عنوان الگویی موفق توسط سایر سازمانهای مردم نهاد غیردولتی در داخل و خارج کشور مورد بهره برداری قرار گیرد.
۲۰۵.

بخش بندی مشتریان سازمان بنادر و دریانوردی با به کارگیری شبکه عصبی خودسازمانده و الگوریتم K-Means(مقاله علمی وزارت علوم)

کلیدواژه‌ها: مشتریان سازمان بنادر و دریانوردی خوشه بندی مشتریان الگوریتم K Means الگوریتم SOM داده کاوی تحلیل RFM

حوزه‌های تخصصی:
تعداد بازدید : ۶۰۴ تعداد دانلود : ۲۲۰
با توجه به اینکه در سال های اخیر ارتباط دو طرفه سازمان ها با مشتریانشان به صورت محسوسی تغییر کرده، تداوم کسب و کار هیچ گونه تضمین بلند مدت ندارد. لذا سازمان ها به جهت حفظ توانایی رقابت در این بازار نامطمئن، میبایست مشتریان خود را به خوبی شناسایی، نیاز ها و خواسته های آن ها را پیش بینی نموده و با مجهز شدن به این اطلاعات و ارائه استراتژی های بازاریابی کارآمد در جهت حفظ و بقای خود تلاش نمایند. با توجه به اهمیت و سهم بالای درآمد بنادر ایران در اقتصاد داخلی و وجود رقابت شدید بین بنادر منطقه، ضرورت شناسایی مشتریان کلیدی و تعیین نیازها و خواسته های آنها برای سازمان بنادر و دریانوردی بیشتر از گذشته احساس می گردد.از سوی دیگر داده کاوی که علم تجزیه و تحلیل داده ها است به عنوان پل ارتباطی بین قسمت هایی از داده معرفی می شود. در همین خصوص ابزارهایی در داده کاوی مانند خوشه بندی و طبقه بندی وجود دارند که شرایط لازم برای ارائه خدمت مورد نظر به مشتریان خوشه هدف و برقراری ارتباط تنگاتنگ با آن ها را برای سازمان ایجاد می نماید. در این پژوهش تحلیل RFM روی داده های پردازش شده 595 مشتری سازمان بنادر در طول یکسال انجام و فرایند خوشه بندی با استفاده از خروجی تحلیل RFM و دو الگوریتم خوشه بندی K - means و SOM انجام می گردد که به منظور تعیین تعداد بهینه خوشه ها از شاخص سیلوئت استفاده می گردد (12 خوشه تعیین گردید). در انتها کیفیت خوشه ها با استفاده از معیار انحراف معیار داده های درون خوشه ها ارزیابی و نتایج به دست آمده از دو روش مقایسه می گردد. با توجه به اینکه کیفیت خوشه های حاصل از الگوریتم SOM بهتر از k-means می باشد بر اساس خوشه های به دست آمده از الگوریتم SOM بدین ترتیب مشتریان کلیدی و با ارزش مشخص می گردد. بر اساس تجزیه و تحلیل نتایج مشخص گردید مشتریان خوشه های 9 و 12 منتج از الگوریتم SOM با دارا بودن الگوی ↑ M ↑ F ↑ R بیشترین ارزش و وفاداری را برای سازمان بنادر دارند و مهمترین مشتریان سازمان بنادر محسوب می شوند و مشتریان خوشه نخست منتج از الگوریتم SOM با دارا بودن الگوی ↓ M ↓ F ↓ R کمترین میزان ارزش و وفاداری را برای سازمان بنادر دارند.
۲۰۶.

بررسی امکان مدل سازی میزان تغییرات کالبدی بافت های شهر با استفاده از داده کاوی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تغییرات کالبدی بافت شهر داده کاوی محله فیض آباد کرمانشاه

حوزه‌های تخصصی:
تعداد بازدید : ۳۶۰ تعداد دانلود : ۲۷۲
پیش بینی آهنگ تغییرات کالبدی بافت های شهری یکی از عوامل تاثیرگذار بر کیفیت طراحی و برنامه ریزی شهری به شمار می رود. هدف از انجام این پژوهش تدوین شیوه ای برای مدلسازی آهنگ تغییرات کالبدی بافت های شهری است به گونه ای که علاوه بر سهولت استفاده، امکان پیش بینی تغییرات را از طریق پایش دوره های پیشین فراهم سازد. از این رو با استفاده از تحلیل رگراسیونی خطی، آهنگ تغییرات فرم بافت برای یک دوره زمانی خاص مدل شده و میزان تغییرات آن مشخص گردید. در راستای آزمودن این شیوه، قسمتی از بافت محله فیض آباد شهر کرمانشاه مورد مطالعه قرار گرفته و بواسطه استخراج اطلاعات مربوط به چهار دوره از روی تصاویر هوایی، وضعیت بافت برای سال هدف مدل گردید. مقایسه اطلاعات مدل شده با وضعیت واقعی بافت نشان داد که مدل ایجاد شده کاربرد پذیر بوده و در مناطق مصون از تغییرات مبتنی بر طرح های شهری منطقه مورد مطالعه از دقت بیش از 70 درصد برخوردار می باشد.
۲۰۷.

بررسی عوامل مؤثر بر قاچاق کالاهای سلامت محور و راهکارهای مبارزه با آن

کلیدواژه‌ها: آمار قاچاق داده کاوی کالاهای سلامت محور

حوزه‌های تخصصی:
تعداد بازدید : ۸۱۹ تعداد دانلود : ۲۵۹
قاچاق کالا، حاصل یک فرآیند اقتصادی ناپسند و زیان بار است که خسارت های اقتصادی، اجتماعی و فرهنگی گسترده ای به کشورها وارد می کند. اقتصاد کشور ما با حجم گسترده ای از انواع قاچاق کالا مواجه است. در میان کالاهای قاچاق، کالاهای سلامت محور مشتمل بر دارو، مواد خوراکی و آشامیدنی، فرآورده های آرایشی و بهداشتی، تجهیزات و ملزومات پزشکی علاوه بر مشکلات اقتصادی، تأثیرات بسیار سوئی بر سلامت جامعه دارند. مقابله جدی با قاچاق کالاهای مرتبط با سلامت از اهمیت بالایی برای بهبود وضعیت سلامت جامعه برخوردار است.هدف اصلی این مطالعه، استفاده از ابزارها و آمارها و داده کاوی در حوزه های مختلفی مانند شناسایی و اولویت بندی عوامل قاچاق کالا و آثار آن و همچنین یافتن شیوه هایی مناسب برای پیشگیری از قاچاق کالاهای مرتبط با سلامت است. نمونه آماری این تحقیق، 100 نفر از دانشگاهیان و افراد درگیر با قاچاق کالای سلامت محور هستند. ابتدا دلایل فعالیت های تجاری قاچاق مورد بحث قرار می گیرد، سپس آثار و پیامدهای قاچاق کالا بررسی شده و در پایان شیوه هایی برای پیشگیری از قاچاق کالا ارائه می شود.
۲۰۸.

شناسایی روابط موضوعی بین منابع مورد استفاده توسط کاربران مرکز منطقه ای اطلاع رسانی علوم و فناوری با استفاده از تکنیک متن کاوی(مقاله پژوهشی دانشگاه آزاد)

تعداد بازدید : ۱۷۵ تعداد دانلود : ۱۶۳
هدف: هدف اصلی پژوهش حاضر بررسی روابط موضوعی در عناوین منابع مورد استفاده توسط کاربران رایسست با استفاده از تکنیک متن کاوی بود. بنابراین، به بازتاب چگونگی روابط موضوعی در منابع اطلاعاتی کاربران در مرکز رایسست مبادرت شده، تا از طریق شناخت به رفتار و احساس استفاده کنندگان دست یابند. روش پژوهش: روش پژوهش مبتنی بر متن کاوی بود، که به داده کاوی بر روی متن، تحلیل متن و به منظور فرایند استخراج اطلاعات با کیفیت از متن اشاره دارد. دسترسی اطلاعات به متن کامل مقالات مجلات علمی – پژوهشی، علمی – ترویجی، مجموعه مقالات کنفرانس ها و همایش های علمی، کتاب های لاتین و فارسی جامعه آماری پژوهش را تشکیل داده، که با استفاده از روش سرشماری، کلیه داده های حاصل از گزارش گیری توسط رایسست بررسی گردید. به منظور تجزیه و تحلیل داده ها و تحلیل متن از نرم افزار ویانت، و برای پاکسازی و نرمال سازی داده ها از نرم افزار پایتون بهره جویی گردید. یافته ها: براساس یافته ها از داده های حاصل شده، 21 کلمه و 160 کلمه موضوعی پرتکرار از منبع مورد استفاده در پایگاه اطلاعاتی رایسست مشخص گردید. دور نمای لوم از چگونگی توزیع کلمات موضوعی با تکرار بالا تهیه شده و ضریب همبستگی تکرار موضوعات پر استفاده در عنوان های منابع اطلاعاتی تدوین شد. به منظور تدوین نمایه درهم کرد کلمات موضوعی پر تکرار ترند (Trend) استفاده شد. نتیجه گیری: نتایج نشان داد که تدوین پژوهش در مجموعه سازی منابع الکترونیکی پایگاه های اطلاعاتی و پیش نگری در آینده این دسته از منابع به مدیران مراکز اطلاع رسانی و کاربران آنها مفید است.
۲۰۹.

بخش بندی بازار مشتریان بالقوه میوه های ارگانیک با رویکرد داده کاوی (مطالعه موردی: شهر تهران)(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۲۰ تعداد دانلود : ۱۶۶
هدف: امروزه سلامتی مصرف کنندگان محصولات کشاورزی و غذایی به دلیل وجود عادات فعلی تولید و مصرف مواد غذایی ناپایدار به خطر افتاده است و لذا کشاورزی ارگانیک به سبب عدم استفاده از افزودنی های غذایی، مواد شیمیایی و مصنوعی، می تواند به عنوان جایگزینی مناسب، توسعه و بهبود یابد. از ابتدایی ترین گام ها برای ترویج مصرف محصولات ارگانیک، بخش بندی مشتریان بالقوه است. روش شناسی: جامعه آماری این تحقیق شهروندان تهرانی هستند که تمایل به مصرف میوه های ارگانیک دارند. بدین منظور با استفاده از فرمول کوکران، حجم نمونه معادل 384 نفر انتخاب شد و داده های تحقیق به وسیله پرسشنامه جمع آوری شد که پایایی آن با ضریب آلفای کرونباخ 0.937 تأیید شد. برای تحلیل داده های تحقیق با رویکرد داده کاوی از روش خوشه بندی k میانگین استفاده گردید. یافته ها: براساس یافته های تحقیق، باز مشتریان بالقوه در شهر تهران به پنج خوشه تقسیم گردید که توصیف ویژگی های جمعیت شناختی، رفتاری و روان شناختی هر خوشه بیان گردید. دو متغیر سهولت دسترسی به اطلاعات و کیفیت درک شده، بیشترین تأثیر و دو متغیر وجود محصولات ارگانیک در سبد غذایی مصرفی و هنجارهای ذهنی، کمترین تأثیر را در خوشه بندی مشتریان داشته اند. نتیجه گیری: در نهایت پیشنهاد می شود سیاست گذاران به برنامه ریزی سیاست های فرهنگی، حمایتی و کنترلی پرداخته و تولیدکنندگان و فروشندگان میوه های ارگانیک با کمک بازاریابی دیجیتال به جلب اعتماد مشتریان بالقوه خود بپردازند.
۲۱۰.

تجزیه و تحلیل ارزش مشتریان بر مبنای مدل WRFM با روش ترکیبی داده کاوی (مورد مطالعه: محصولات بهداشتی و آرایشی)(مقاله علمی وزارت علوم)

تعداد بازدید : ۳۱۸ تعداد دانلود : ۲۶۳
انباشت اطلاعاتی و ایجاد پایگاه های داده ای باعث شده است تا شرکت هایی که قصد دارند به مشتریان خود خدمات مناسب تری را ارایه کنند به سوی بهره مندی از ابزارهای نوین ارتباط با مشتری حرکت نمایندکه یکی از این ابزارها و روش ها، تکنیک های داده کاوی است که می تواند نقش مهم وکلیدی در مدیریت ارتباط با مشتری ایفا کند. هدف این پژوهش تحلیل ارزش مشتریان با رویکرد ترکیبی داده کاوی بر اساس مدل  WRFM است  بر این اساس 64858 نمونه از پایگاه داده مشتریان در دوره 1398- 1399 با روش نمونه گیری هدفمند در دسترس انتخاب شده است. وزن شاخص های مدل WRFM با نظرسنجی از 3 کارشناس خبره شرکت به کمک فرآیند تحلیل سلسله مراتبی تعیین شده است. بر اساس متغیرهای اولیه پژوهش و متغیرهای بدست آمده از شاخص های مدل WRFM ، ارزش خرید مشتریان تجزیه و تحلیل شده است. برای تجزیه وتحلیل داد ه ها از نرم افزار SPSS Modeler و SPSS استفاده شد. نتایج نشان می دهد که روش خوشه بندی K-Means نسبت به روش های خوشه بندی دو مرحله ای و شبکه عصبی کوهنن عملکرد بهتری دربخش بندی مشتریان داشته است در نهایت براساس معیارهای درصد خلوص، تکرار، میزان خطا و شاخص اطلاعات متقابل نرمال شده ( NMI ) از خوشه بندی های مختلف K-Means ، شش خوشه با امتیاز NMI (0/631) انتخاب شده است. این پژوهش مدل WRFM را برای تجزیه و تحلیل ارزش مشتری معرفی کرده است که وزن شاخص های این مدل با نظرسنجی از کارشناسان و با استفاده از فرآیند تحلیل سلسله مراتبی و بر اساس میزان ناسازگاری (0/052) که از روش تحلیل سلسله مراتبی بدست آمده است به ترتیب  (0/15)، (0/29) و (0/56) تعیین شده است که این مقادیر نشان دهنده اهمیت بیشتر شاخص ارزش پولی نسبت به دو شاخص دیگر  بوده است . در نهایت این شش خوشه با استفاده از شیوه نامگذاری بخش های بازار در پژوهش های(چانگ و تسای  2004؛ باباییان و سرفرازی 2019) در 4 دسته کلی: مشتریان کلیدی و ویژه، مشتریان بالقوه طلایی، مشتریان نامطمئن ازدست رفته و مشتریان نامطمئن جدید قرارگرفتند. بر طبق مدل پژوهش، شرکت باید بیشتر بر مشتریان خاص وکلیدی خود یعنی مشتریانی که در خوشه های اول، سوم و پنجم قرارگرفته اند تمرکز داشته باشد یعنی مشتریانی وفاداری که ضمن تداوم خرید خود دارای مقادیر بالاتر از میانگین در دو شاخص ارزش پولی و دفعات خرید بوده و به تازگی نیز خریدهای با ارزش ریالی بالا داشته اند که شرکت باید با توجه به منابع محدود خود استراتژی های بازاریابی کارآمدی برای این دسته از مشتریان درنظرگیرد تا ضمن حفظ مدیرت ارتباط با مشتری به سودآوری بیشتر برای شرکت منجر شود.  
۲۱۱.

کاربست قوانین انجمنی و خوشه بندی در کنترل کیفیت داده های پژوهشی؛ مورد مطالعه پایگاه اطلاعات علمی ایران (گنج)(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۱۶ تعداد دانلود : ۲۲۸
پایگاه های اطلاعات علمی و موتورهای جستجو از ابزارهای اصلی کار پژوهشگران است. برای بازیابی دقیق و صحیح اطلاعات از این پایگاه ها نیاز است که اطلاعات با کیفیت مناسب وبا کمترین خطا ذخیره شوند. کنترل دستی اطلاعات زمانبر و پر هزینه است، در این مقاله، روش های داده کاوی برای کنترل کیفیت یک پایگاه اطلاعات پژوهشی معرفی می شود. برای این منظور ابتدا باید اطلاعاتی از خطاهای مرسوم را در کنار سایر اطلاعات هر رکورد جمع آوری کرد. سپس با استفاده از روش های داده کاوی الگوهای پنهان و روابط بین خطاها را کشف کرد و بر این اساس راه های بهبود کیفیت داده را ارائه داد. در این مقاله پایگاه اطلاعات علمی ایران (گنج)، به عنوان مطالعه موردی در نظر گرفته شد. 59 کد خطا توسط خبرگان تعریف شد.  سپس اطلاعات فراداده هر رکورد مثل نام دانشگاه، نام رشته،گرایش و حوزه تخصصی مدرک به همراه کدهای خطای آن در یک مجموعه داده  ذخیره شد. این مجموعه داده شامل 41021  رکورد  در حوزه های مختلف است. با استفاده از روش های آماری و قوانین انجمنی رابطه بین خطاها و الگوی تکرار آنها را درهرحوزه بررسی شد. نتایج نشان داد  به طور میانگین با در نظر گرفتن 25 درصد از خطاها در هر حوزه، می توان تا 80 درصد از خطاهای همه رکوردهای یک حوزه را کاهش داد. این خطاها شامل خطاهای پر تکرار در هر حوزه و همچنین خطاهایی است که با آن ها رابطه قوی دارند. با استفاده از روش خو شه بندی k-means رکوردها خوشه بندی شدند. نتایج نشان داد اگر چه شباهت هایی بین رکوردها از حوزه های مختلف وجود دارد، اما رابطه معناداری بین حوزه رکوردها و الگوی تکرار خطاها وجود ندارد.
۲۱۲.

بررسی وب سایت های شهرداری تهران و ارایه راه کارهای مناسب داده کاوی(مقاله پژوهشی دانشگاه آزاد)

تعداد بازدید : ۲۳۱ تعداد دانلود : ۱۷۵
< p>هدف: هدف اصلی این پژوهش، شناسایی و تجزیه و تحلیل انواع داده های وب سایت شهرداری تهران و ارایه راه کارهای مناسب داده کاوی است. روش پژوهش: این پژوهش بنیادی است و از لحاظ ماهیت می توان آن را تحلیلی در نظر گرفت. روش گردآوری داده های به صورت میدانی بوده است و جامعه آماری 47 سایت که از 220 دامنه شهرداری تهران انتخاب شده است و برای تجزیه و تحلیل از تکنیک های داده کاوی استفاده شده است و منبع گردآوری داده ها وب سنجی و ابزار مورد استفاده گوگل آنالیتیکس می باشد. یافته ها: میزان دقت الگوریتم شبکه عصبی معمولی برابر با 25/99%  و در نهایت معیار آر.ام.اس.ای الگوریتم شبکه عصبی معمولی برابر با 159/0 است. میزان دقت الگوریتم درخت تصمیم برابر با 99.80% ؛  معیار ام.اس.ای الگوریتم درخت تصمیم برابر با 003/0 و در نهایت معیار آر.ام.اس.ای الگوریتم درخت تصمیم برابر با 045/0است. میزان دقت الگوریتم کی.ان.ان برابر با 81/99%  و در نهایت معیار آر.ام.اس.ای الگوریتم کی.ان.ان برابر با 035/0 است نتیجه گیری: بر اساس یافته های بدست آمده روش دی.بی.اسکن با سایر روش های پایه جهت تجزیه و تحلیل داده های وب سایت های شهرداری تهران برابر و نسبت به سایر روش ها از دقت بالاتری برخوردار است.
۲۱۳.

تحلیل نظرات کاربران وب سایت های تجارت اجتماعی بر اساس روش های متن کاوی و داده کاوی(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۱۷ تعداد دانلود : ۱۴۷
هدف از این پژوهش مطالعه و تحلیل نظرات کاربران وب سایت های تجارت اجتماعی با بهره گیری ترکیبی از تکنیک های متن کاوی و داده کاوی است. بدین منظور پایگاه داده وب سایت تریپ ادوایزر مورد ارزیابی قرار گرفته و از میان همه کاربرانی که در مورد یکی از هتل های شهر لیسبون پرتغال ابراز نظر کرده اند، نمونه گیری سیستماتیک انجام می شود. سپس همه نظرات این کاربران نمونه در مورد همه مطالب از قبیل هتل ها، رستوران ها و اماکن دیدنی استخراج شده و با استفاده از نرم افزار رپیدماینر و تکنیک های متن کاوی و داده کاوی تجزیه و تحلیل می شوند. محاسبه شاخص دیویس و بولدین بهینه ترین تعداد خوشه، سه به دست می آید و کاربران به سه خوشه تقسیم می شوند. هر خوشه دارای ویژگی های منحصر به فردی است که پرتغال دوست، رستوران دوست و سفر دوست نامیده می شوند. سپس بر اساس ویژگی های هر خوشه و اطلاعات موجود در پروفایل کاربران با استفاده از قواعد انجمنی اقدام به شناخت بیشتر هر خوشه می شود. در انتها متناسب با ویژگی های تحلیل شده هر خوشه اقدام به ارائه راهکار جهت افزایش مشارکت آن ها در وب سایت کرده، و پیشنهاد های ترفیعی هدفمندی برای هر کدام از این خوشه ها بیان می شوند.
۲۱۴.

تعیین هوشمند اندازه بار در آزمون وینگیت با استفاده از تکنیک های داده کاوی(مقاله علمی وزارت علوم)

تعداد بازدید : ۲۷۱ تعداد دانلود : ۱۸۷
زمینه و هدف: آزمون وینگیت شامل 30 ثانیه تمرین فوق بیشینه روی یک دوچرخه کارسنج است که میزان بار اعمال شده براساس وزن فرد تعیین می شود. اندازه بار علاوه بر وزن آزمودنی به پارامترهایی از جمله سن و جنسیت نیز وابسته است. عاوه بر پارامترهای نامبرده شده، پارامتر هایی ازقبیل میزان سطح ورزشی، درصد چربی زیر پوستی و سطح مصرف دخانیات آزمودنی نیز در تعیین اندازه بار تاثیرگذار می باشند. هدف از پژوهش حاضر ارائه یک روش هوشمند با استفاده از تکنیک داده کاوی برای تعیین اندازه بار در آزمون وینگیت با توجه به تمامی پارامتر های مداخله گر می باشد . روش تحقیق: آزمون وینگیت به وسیله چرخ کارسنج(مونارک 894) سه نوبت روی 30 نفر داوطلب مرد ازدانشجویان دانشگاه اصفهان انجام شد. در این تحقیق از نرم افزار راپیدماینر برای تجزیه و تحلیل داده ها استفاده شده است . یافته ها : براساس الگوریتم های داده کاوی ویژگی هایی که بیشترین تاثیر را به ترتیب در پیش بینی میزان بار داشته اند شامل: قد، وزن، سن، ورزش، میزان چربی زیرپوستی خاصره ای و میزان چربی زیر پوستی شکمی می باشد . نتیجه گیری: بر اساس نتایج به دست آمده از این تحقیق، تکنیک داده کاوی توانسته است اندازه بار را چه برای داد ههای آموزشی و چه برای داد ههای آزمایشی پیش بینی کند. بنابراین با استفاده از تکنیک مورد نظر می توان اندازه بار را برای افراد بطور دقیق پیش بینی کرد. نرم افزار حاصل از این تحقیق درحال ویرایش نهایی برای ارائه به بازار است.
۲۱۵.

استخراج دانش از داده های بیماران دیابتی با استفاده از روش درخت تصمیم C5.0(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: دیابت نوع دو عوارض دیابت داده کاوی الگوریتم C 5.0 شبکه عصبی

حوزه‌های تخصصی:
تعداد بازدید : ۲۳۹ تعداد دانلود : ۱۳۳
مقدمه: بروز دیابت در ده سال اخیر در سطح جهان دو برابر شده است . حدود 200 میلیون نفر به این بیماری مبتلا هستند و سالانه شیوع دیابت در جهان حدود شش درصد افزایش می یابد. بیش از دو میلیون نفر در ایران به این بیماری مبتلا هستند. در این تحقیق به بررسی ارتباط بین عوارض مشاهده شده در بیماران دیابتی نوع دو و برخی ویژگی های آن ها از قبیل میزان قند خون، فشار خون، سن و سابقه خانوادگی بیماران می پردازیم. هدف این مطالعه، پیش بینی عوارض بیماران بر اساس علائم مشاهده شده در آن ها است. روش کار: داده های مورد نیاز برای این تحقیق از پرونده های سال 1388 مرکز دیابت استان گلستان جمع آوری شده است. تعداد پرونده های اولیه بیماران 856 رکورد بود. در این مقاله مدل جدیدی بر اساس متدولوژی استاندارد CRISP ارائه شده است. در بخش مدل سازی از دو روش شناخته شده در داده کاوی به نام های درخت تصمیم C5.0 و شبکه عصبی استفاده شده است. برای تحلیل داده ها از نرم افزار Celementine 12.0 استفاده شده است. یافته ها: در این تحقیق برای اولین بار احتمال بروز عوارض میکروواسکولار، ماکروواسکولار و یا هر دو نوع عارضه در بیماران و ویژگی های تأثیرگذار بر آن ها مورد بررسی قرار گرفته است. با استفاده از داده کاوی و روش های آن تعیین شده است که متغیر های فشار خون بالا، سن و سابقه خانوادگی در عوارض مشاهده شده بیشترین تأثیر را داشته اند. به کمک درخت تصمیم ایجاد شده، قوانینی استخراج شده اند که می تواند به عنوان الگویی برای پیش بینی وضعیت بیماران و احتمال بروز عوارض در آن ها استفاده شود. صحت مدل ایجاد شده بر روی داده های مورد استفاده در درخت تصمیم C5.0، 89.74 درصد و در شبکه عصبی مصنوعی 51.28 درصد می باشد. نتیجه گیری: با توجه به روش های استفاده شده، بالاترین دقت با استفاده از الگوریتم C5.0 به دست آمده است. بیشترین عوامل تأثیرگذار بر بروز عوارض شناسایی شدند. با توجه به قوانین ایجاد شده برای یک نمونه جدید با ویژگی های مشخص، می توان پیش بینی کرد بیمار احتمالاً دچار چه نوع عارضه ای خواهد شد.
۲۱۶.

تعیین عوامل مؤثر بر مرگ ومیر بیماران سوختگی با استفاده از الگوریتم داده کاوی درخت تصمیم(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: داده کاوی درخت تصمیم سوختگی

حوزه‌های تخصصی:
تعداد بازدید : ۲۷۲ تعداد دانلود : ۱۷۱
مقدمه: در سال های اخیر استفاده از روش های داده کاوی روی حجم زیادی از داده ها با هدف تولید مدل ها و الگوهای پیش بینی کننده در حیطه های متعدد پزشکی رواج یافته است. در این مطالعه پژوهشگران قصد دارند با استفاده از الگوریتم داده کاوی درخت تصمیم، عوامل موثر بر مرگ ومیر بیماران سوختگی را مشخص نمایند. روش کار: این پژوهش توصیفی گذشته نگر است که مبتنی بر اطلاعات پرونده های بیمارستانی می باشد. در مجموع 4804 پرونده پزشکی مربوط به بیماران سوختگی، مورد بررسی قرار گرفت. داده های گردآوری شده با استفاده از نرم افزارهای تحلیل آماری SPSS-16 و داده کاوی Clementine-12 و از طریق الگوریتم (Chi-squared Automatic Interaction Detection: CHAID) مورد تجزیه و تحلیل قرار گرفتند. یافته ها: مدل پیش بینی فوت و زنده ماندن برای بیماران سوختگی که کارایی آن توسط پژوهشگران اثبات گردید، به ترتیب اهمیت شامل درصد سطح سوختگی، درجه سوختگی، مدت زمان بستری، جنسیت و سن می باشد. سایر متغیرهای مورد مطالعه شامل کشت خون، کشت زخم، کشت ادرار، عامل سوختگی و ماه بستری بیمار در کارایی مدل تاثیری نداشتند. نتیجه گیری: با توجه به میانگین دقت مدل پیشنهادی(تقریباً 95درصد) و میانگین دقت مدل روی داده های آزمون(تقریباً 95درصد)، مدل پیشنهادی معتبر و قابل استناد می باشد. در حقیقت، نتایج این مطالعه یک مدل جامع، دقیق و معتبر پیش بینی فوت و زنده ماندن بیماران سوختگی را بر اساس متغیرهای فوق الذکر که بعضی از آن ها با نتایج سایر پژوهشگران مطابقت دارد پیشنهاد می کند. لذا چنین مدلی می تواند به عنوان یک معیار مهم ارزیابی جهت درمان موثر بیماران سوختگی مورد استفاده قرار بگیرد.
۲۱۷.

استفاده از تکنیک داده کاوی در بررسی فاکتورهای تاثیرگذار در عدم موفقیت روش انتقال داخل رحمی در درمان ناباروری(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: ناباروری روش IUI داده کاوی روش های توصیفی الگوریتم Kmeans

حوزه‌های تخصصی:
تعداد بازدید : ۱۴۹ تعداد دانلود : ۱۷۸
مقدمه : ناباروری یکی از مسائلی است که امروزه هزینه های مادی و معنوی زیادی را بر روی دوش زوجین نابارور قرار داده است. روش انتقال داخل رحمی اسپرم ( IUI ) یکی از روش های درمانی برای این گروه از زوجین می باشد. غیرقابل پیش بینی بودن نتیجه این روش ضرورت بررسی و شناسایی عواملی را که بر روی میزان اثربخشی آن تاثیرگذار هستند، دوچندان کرده است. لذا هدف این مطالعه شناسایی عوامل موثر در عدم موفقیت این روش با بکارگیری تکنیک های داده کاوی روی داده های مربوط به زوجین نابارور بیمارستان صارم می باشد که از روش IUI استفاده کرده و نتیجه این روش بر روی آنها ناموفق بوده است. روش کار : با استفاده از یکی از تکنیک های توصیفی داده کاوی یعنی الگوریتم Kmeans و شاخص Davis - Buldian بیماران به 7 گروه تقسیم شدند و ویژگی های هر گروه مورد تحلیل و بررسی قرار گرفت. یافته ها : بررسی و تحلیل ویژگی های هریک از 7 گروه بدست آمده، این نتایج را به همراه داشت: بر اساس نتایج خوشه بندی به ترتیب اهمیت عواملی هم چون افزایش سن زن، اضافه وزن و یا چاقی، نوع ناباروری که در این مطالعه اکثریت گروه بیماران نوع اولیه را تجربه کرده، عامل ناباروری که در اینجا اکثریت گروه بیماران به دلیل مردانه نابارور بوده، طول مدت ناباروری و نیز وضعیت اسپرم از لحاظ نرمال یا غیرنرمال بودن آن روی عدم موفقیت روش IUI در زوجین نابارور بیمارستان صارم تاثیر داشته است. نتیجه گیری : با تحلیل نتایج خوشه بندی، عوامل تاثیرگذار در عدم موفقیت روش IUI بر روی زوجین نابارور شناسایی شد . این نتایج با مشورت با خبرگان می تواند برای پیش بینی نتیجه روش IUI و انتخاب روش درمانی مناسب به محققین، پزشکان و زوجین نابارور کمک کند.
۲۱۸.

ارائه مدل پیش بینی تشخیص عوامل ناباروری؛ با استفاده از الگوریتم های داده کاوی(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: ناباروری مدل داده کاوی K-means ماشین بردار پشتیبان شبکه های عصبی مصنوعی

حوزه‌های تخصصی:
تعداد بازدید : ۲۷۳ تعداد دانلود : ۱۷۵
مقدمه: حدود 15-10 درصد از زوجین نابارور هستند. ناباروری علل متفاوتی دارد و تشخیص روش درمان بیماران بر اساس نوع عامل ناباروری آن ها انجام می شود. در این تحقیق مدلی ارائه شده است که بر اساس ویژگی های اولیه و نتایج آزمایشات ساده علل ناباروری افراد را پیش بینی می کند که می تواند به پزشکان در تشخیص زودهنگام علت ناباروری و تصمیم گیری بهینه کمک کند. روش کار: داده های این تحقیق برگرفته از داده های ناباروری بیمارستان صارم تهران می باشد. در این تحقیق از روش های دادهکاوی استفاده شده است. ابتدا روش خوشه بندی k-means و سپس روش های دسته بندی ماشین بردار پشتیبان (SVM: Support Vector Machine) و شبکه های عصبی مصنوعی به منظور پیش بینی نوع علل ناباروری، اجرا و نتایج دو الگوریتم دسته بندی با هم مقایسه شدند. همچنین برای تحلیل داده ها و اجرای الگوریتم های بخش مدل، از نرم افزار SPSS Clementine 12.0 استفاده شده است. یافته ها: در بخش خوشه بندی بر اساس الگوریتم K-means داده ها به پنج خوشه تقسیم شدند. در هر گروه یک یا چند علت ناباروری مشاهده شد. در ادامه و با اجرای الگوریتم های دسته بندی SVM و شبکه عصبی مصنوعی، مشخص شد که الگوریتم SVM با نوع کرنل چندجمله ای بالاترین کارایی را به دست آورد. نتیجه گیری: انجام این تحقیق علاوه بر اینکه منجر به شناخت بهتر ویژگی های بیماران ناباروری شد، می تواند زمینه ای برای انجام تحقیقات آتی باشد. از آنجائی که با تشخیص علل ناباروری افراد قبل از مراحل ثانویه و آزمایشات سنگین، به مقدار قابل توجهی در هزینه و زمان صرفه جویی و از اثرات جسمی که بر بیماران می گذارد کاسته خواهد شد، می توان در مطالعات آینده با استفاده از نتایج این تحقیق سیستمی را جهت اجرای این مدل پیاده سازی نمود.
۲۱۹.

شناسایی عوامل مرتبط با طول مدت اقامت بیمارستانی با استفاده از درخت تصمیم(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: طول مدت اِقامت عوامل مرتبط داده کاوی درخت تصمیم

حوزه‌های تخصصی:
تعداد بازدید : ۲۲۴ تعداد دانلود : ۱۹۲
مقدمه:یکی از عوامل اصلی هزینه های بیمارستانی طول مدت اقامت می باشد که باعث محدودیت منابع در بیمارستان می گردد. شناسایی عوامل مرتبط با این شاخص جهت بهره بردای بهینه از منابع و کاهش مدت اقامت ، می تواند مفید باشد. مطالعه حاضر با هدف بررسی عوامل مرتبط با طول مدت اقامت با استفاده از اعمال درخت تصمیم بر روی داده های پذیرش بیمارستان انجام شد. روش کار:این مطالعه از نوع توصیفی گذشته نگر است. نمونه های مورد مطالعه از 188068 پرونده ی کامپیوتری بیماران بستری در تمام بخش های بیمارستان قائم(عج) مشهد شامل 16 متغیر و در بازهی زمانی ابتدای سال 1388 تا انتهای سال 1392 خورشیدی استخراج شد. پس از پاکسازی داده ها، جهت تعیین عوامل مرتبط با طول مدت اقامت، از تحلیل تک متغیره شامل تست های آماری کای دو و تحلیل واریانسیک طرفه و همچنین الگوریتم درخت تصمیم CHAIDدر نرم افزار SPSS نسخه 19 استفاده گردید. یافته ها:میانگین مدت اقامت در بیمارستان مورد مطالعه 5/6 با میانه چهار روز بوده است. از بین 15 متغیر مستقل وارد شده به درخت تصمیم، 11 متغیر شامل بخش بستری، سن، دلیل مراجعه، پزشک معالج، نحوه مراجعه، شغل، وضعیت تأهل، نوع محل زندگی، داشتن همراه، روز پذیرش در هفته، و نوع بیمه، به عنوان عوامل مرتبط با LOS شناخته شدند. نتیجه گیری:نتایج تکنیک های داده کاوی می تواند بر اساس داده های ورودی متفاوت باشد، لذا جهت آگاهی از عوامل مرتبط با طول مدت اقامت لازم است داده های مربوط به هر بیمارستان به طور جداگانه وارد مدل شده و از نتایج بهدست آمده، در همان بیمارستان استفاده شود.
۲۲۰.

تحلیل تراکنش های امانت و گردش منابع کتابخانه های دانشگاه علوم پزشکی بیرجند با الگوریتم های داده کاوی(مقاله پژوهشی وزارت بهداشت)

کلیدواژه‌ها: داده کاوی اداره کتابخانه بررسی های پیمایشی کتابخانه خودکارسازی کتابخانه مدیریت اطلاعات

حوزه‌های تخصصی:
تعداد بازدید : ۲۰۷ تعداد دانلود : ۱۲۵
مقدمه: داده کاوی فرآیندی رایانه ای برای کشف روابط و الگوهای معنادار بین داده های بزرگ است. شناسایی الگوهای رفتاری کاربران به بهبود تصمیم گیری در کتابخانه ها کمک می کند. هدف این پژوهش تحلیل تراکنش های گردش منابع کتابخانه های دانشگاه علوم پزشکی بیرجند با الگوریتم های داده کاوی است. روش کار: در این مطالعه توصیفی، برای تعیین الگوهای پنهان در داده های گردش منابع کتابخانه های دانشگاه علوم پزشکی بیرجند، از روش های داده کاوی استفاده شد. اطلاعات اعضا و تراکنش های گردش منابع از نرم افزار کتابخانه استخراج شد و پس از پالایش و افزودن فیلدهای محاسباتی، در قالب فایل های اکسل ذخیره شدند. برای انجام مراحل مختلف کشف دانش، از افزونه داده کاوی Microsoft SQL Server 2008 در نرم افزار آفیس 2007 استفاده شد. ماتریس طبقه بندی، برای محاسبه میزان صحت مدل های تولیدشده، به کاربرده شد. یافته های پژوهش در قالب شکل و جدول گزارش شدند. یافته ها: 394011 تراکنش امانت و بازگشت کتاب توسط 5600 عضو تا پایان سال 1392 در نرم افزار کتابخانه ثبت شده بودند. گردش منابع در هر نیمسال تحصیلی از توالی منظمی برخوردار بود. 87 درصد اعضا، کمتر از 46 روز کتاب های امانتی را بازگشت می دهند و 96 درصد دانشجویان کمتر از 18 روز در عودت کتاب ها تأخیر دارند. اعضا به طور متوسط 35 مدرک در مدت عضویتشان به امانت می گیرند. با استفاده از قوانین وابستگی می توان ارتباط موضوعی مدارک موردعلاقه اعضا را کشف کرد. نتیجه گیری: داده کاوی منجر به شناسایی رفتار اطلاعاتی اعضا، طبقه بندی اعضای فعال و شناسایی عوامل مؤثر بر مدت امانت و دیرکرد مدارک گردید. الگوهای آشکارشده جهت بهبود تصمیم گیری در مدیریت نیروی انسانی و تدوین مقررات خدمات گردش منابع کتابخانه پیشنهاد می شود