0086-21-58386256
در ابتدای مطلب، مقدمهای درباره مفهوم داده کاوی و اهداف آن ارائه خواهیم کرد. سپس، به معرفی ۹ تکنیک داده کاوی میپردازیم و الگوریتمهای پرکاربرد آنها و کاربرد این روشها در جنبههای مختلف زندگی انسان را شرح میدهیم.
بیگدیتا (big data) یا کلانداده چیست؟ کلانداده درواقع اصطلاحی است که برای مجموعههای بسیار بزرگ و متنوع از دادهها که در طول زمان به رشد تصاعدی خود ادامه میدهند، استفاده میشود.
در یادگیری ماشین و یادگیری عمیق، دیتاست (مجموعه داده) مجموعه ای از نمونه های داده است که برای آموزش مدل های یادگیری ماشین استفاده می شود.
آیا ممکن است که درسی ناقص ضبط شده باشد؟ ما همواره تلاش کردهایم که دروس را به طور کامل ضبط نماییم و در اختیار شما دوستان قرار دهیم.
در علوم رایانه، یک مجموعه یک نوع داده انتزاعی است که می تواند مقادیر یکتایی را بدون هیچ ترتیب خاصی ذخیره کند. در واقع این نوع داده، یک پیادهسازی برای مفهوم ریاضی مجموعههای متناهی به زبان رایانه است.
داده های خام گردآوری شده، در شکل اولیه خود ممکن است آنقدر بهم ریخته و زیاد باشند که به راحتی ... مجموعه داده های آماری ما می باشد. ... مثال در طبقه اول با تقسیم 2 بر 50، درصد فراوانی آن طبقه که عدد 4 ...
با سلام و تشکر از زحماتتون در اثبات قضیه ۳ اشتباهی رخ داده است که احتمال میدهم تایپی باشد. اگر بخواهیم ثابت کنیم نقطهای درونی است کافیست یک دلتا معرفی کنیم که همسایگی به شعاع آن داخل مجموعه قرار گیرد.
الگوریتم درخت تصمیم برای رگرسیون. فرض کنید دادههای موجود در گره m با Q m نمایش داده شده و تعداد n m نمونه دارد و t m حد نمونه m است. سپس، الگوریتم درخت تصمیم برای رگرسیون میتواند به صورت زیر نوشته شود:
این کار ممکن است شامل تمیز کردن و پیش پردازش داده ها باشد برای اطمینان از اینکه در قالب قابل استفاده هستند. ... این کار شامل تقسیم داده ها به مجموعه های آموزشی و آزمایشی و سپس بررسی مدل با داده ...
آیا در مورد مجموعه داده ها کنجکاو هستید؟ چگونه اطلاعات را جمع آوری و سازماندهی کنیم تا بینش های ارزشمند را کشف کنیم؟ این وبلاگ به عنوان یک راهنمای جامع برای همه مجموعه داده ها عمل می کند.
این اصطلاح از دهه ۱۹۹۰ میلادی مورد استفاده قرار گرفته است. بیگ دیتا معمولاً شامل مجموعه دادههایی با اندازه های فراتر از توانایی ابزارهای نرم افزاری رایج برای ضبط، مدیریت و پردازش دادهها است.
مجموعه تهی زیر مجموعه همه مجموعه ها است . تعداد زیر مجموعه های یک مجموعه n عضوی برابر است با : ۲به توان n . تساوی مجموعه ها دو شرط دارد : ۱ _ تعداد اعضا بعد از حذف تکراری ها ، برابر باشد . ۲_ اعضا نظیر ...
در این مطلب به مباحث «داده کاوی» (Data Mining) از صفر تا صد پرداخته شده است. با پیشرفت سریع «فناوری اطلاعات» (Information Technology)، بشر شاهد یک رشد انفجاری در تولید «داده» (Data) و ظرفیتهای گردآوری و ذخیرهسازی آن در دامنههای ...
داده چیست؟ داده را در اصل میتوان اطلاعات خام دانست. درواقع داده مجموعهای از حقایق و ارقام پردازش نشده است که میتواند اشکال مختلفی داشته باشد: اعداد، حروف، تصاویر، فیلم، صدا و حتی اطلاعاتی که حسگرها از دستگاههای ...
در برخی موارد، مجموعه داده باید بزرگ باشد تا بتواند مدلهای پیچیده را آموزش دهد، در حالی که در برخی موارد کوچکترین مجموعه داده هم میتواند مناسب است.
Twitter Airline Sentiment: شامل دادههای توییتری مربوط به خطوط هوایی ایالات متحده است که در دستهبندیهای مثبت، منفی و خنثی قرار گرفتهاند؛ این دیتاست یکی از مجموعه دادههای تجزیه و تحلیل احساسات است.
مثال: از فهرست نام ۲۴ عضو یک باشگاه برای انتخاب رئیس، نایب رئیس، خزانه دار و منشی، ۴ نام استخراج میشود. به چند راه مختلف میتوان این کار را انجام داد؟ حل: تعداد جایگشت های متمایزی که ۴ به ۲۴ اختیار میشوند برابر است با
روش تحقیق به «چگونگی» اجرای هر بخش از تحقیق مرتبط است. به طور دقیق تر، می توان گفت که چگونه یک محقق به طور سیستماتیک و منظم یک مطالعه را طراحی می کند تا یافته های معتبر و قابل اعتمادی اطمینانی ایجاد کند و به اهداف تحقیق ...
در یادگیری ماشین و یادگیری عمیق، دیتاست (مجموعه داده) مجموعه ای از نمونه های داده است که برای آموزش مدل های یادگیری ماشین استفاده می شود.هر نمونه داده شامل یک یا چند ویژگی است که ویژگی های داده را توصیف می کند.
حفاظت از داده ها: چگونه از داده های خود محافظت کنیم؟ حفاظت از داده ها مجموعه ای از استراتژی ها، فرآیندها و فناوری های حفاظتی است که هدف اصلی آن حفاظت از محرمانه بودن، یکپارچگی و در دسترس بودن داده ها تحت هر شرایطی و در ...
علاوه بر آن، مولد به تدریج تصاویر موجود در مجموعه داده را بارگذاری میکند و به کاربر این امکان را میدهد تا با مجموعه دادههای کوچک و بسیار بزرگ شامل هزاران یا میلیونها تصویری که در حافظه سیستم ممکن است جا نشوند کار ...
با سلام اگر در این حالت که سه تیرانداز باشند در مورد احتمال به هدف نخورد؟ سه تیرانداز هر کدام یک تیر به یک هدف شلیک می کنند.احتمال آنکه تیرانداز اول به هدف بزند 4.0 است و همین احتمال برای تیراندازهای دوم و سوم به ترتیب 5.0 و 7 ...
اطلاعات یا «داده» (Data) از موثرترین ابزارهای در دسترس هر کسبوکار و سازمانی است که میخواهد در جهان رقابتی و چالشی امروز بهترین باشد. هرچه اطلاعات بیشتر باشد، گزینهها و راهحلهای بهتری نیز برای مسائل و موانع پیش ...
دیتاست به مجموعهای از دادهها اشاره دارد که با هدف تحلیل، آموزش ماشینی، تحقیق و سایر فعالیتهای مشابه، جمعآوری و سازماندهی شده است.
بیش برازش (Overfitting) یکی از خطاهای مدلسازی در علم داده (Data Science) است. این خطا هنگامی اتفاق میافتد که مدل ویژگیهای دادههای آموزشی را بهجای یادگیری، حفظ کرده باشد، یعنی بیشازحد روی آن آموزش دیده باشد؛ درنتیجه، این ...
مجموعه داده صرفاً یک فایل یا ساختار دیگری است که مقادیر دادهها را در قالب خاصی در خود دارد. یک پایگاه داده ممکن است حاوی دادههای یک یا چند مجموعه داده باشد.
روشهای نمونهبرداری احتمالی. روشهای نمونهبرداری غیراحتمالی. تعریف. نمونهبرداری احتمالی یک روش نمونهبرداری است که در آن نمونه هایی از جمعیت بزرگتر با استفاده از روشی بر اساس تئوری احتمال انتخاب می شوند.
الگوریتم های پر کاربردعلم داده در حوزه داده کاوی و یادگیری ماشین ولی قبل از شروع یادگیری الگوریتم ها داده کاوی واجب است یازده نکته طلایی درمورد علم داده که دانستن آن برای همه بسیار لازم است را بدانید.
تغییرپذیری (Variability): تغییرپذیری به ناسازگاری مجموعههای داده اشاره دارد که ممکن است مانع مدیریت فرآیند تحلیل شوند. این امر از آن رو به وقوع میپیوندد که علم داده اغلب منابع داده متغیر را مدل ...
هر فرد دارای 62 تصویر چند حالتی و 6 تصویر چند بیانی است. مجموعه داده شامل زوایای مختلف، حالتها و شرایط نوری است. برای تشخیص چهره و حالت چهره مفید است. داده های چهره زنده و ضد جعل (ارتباط دادن)
اگر تعداد دادههای گمشده کم باشد یا جایگذاری این دست از نمونهها مورد قبول نباشد، میتوان از طریق تابع dropna کتابخانه Pandas، سطرهایی که شامل دادههای گمشده هستند را از مجموعهداده حذف کرد:
مجموعه داده یا دیتاست (Dataset)، مجموعه ای از کلاس های مختلف عارضه ای است که دارای سیستم مختصات مشترکی هستند. از دیتاست ها برای یکپارچه سازی مکانی یا موضوعی کلاس های مختلف عارضه استفاده می شود.
مقدار میانگین یا میانگین عبارت سادهای با معانی مختلف است. نوع میانگینی که ما استفاده میکنیم به این بستگی دارد که مشغول جمع، ضرب، گروهبندی یا تقسیم آیتمهای یک مجموعه باشیم. برای مثال اگر با سرعت 30 کیلومتر بر ساعت ...
نکته: توجه داشته باشید که ممکن است در بعضی از تحلیلهای spss، دادههای متنی قابل استفاده نباشند. برای مثال در تحلیل واریانس (ANOVA) ، متغیری که به عنوان Factor معرفی میشود، نباید متنی باشد.
مدلهای یادگیری ماشین، از طریق «مجموعه آموزشی» (Training Set) که قسمتی از مجموعهداده اصلی است، نحوه اجرای فعالیتهای مورد نظر را یاد میگیرند.
چرا امنیت دادهها مهم است؟ دادهها، شریان حیاتی هر سازمانی هستند، زیرا تصمیمگیریها را هدفمند میکنند، راهحلهایی برای مشکلات ارائه میدهند و عملکرد فعالیتهای تجاری را بهبود میبخشند، بهطوریکه خدمات ...