شبکه عصبی مصنوعی که امروزه در کاربردهای فراوانی ارزش بالای خود را نشان داده اند، بر اساس مدل بیولوژیک مغز انسان به وجود آمده اند. مفهوم شبکه عصبی مصنوعی که در واقع یکی از مهمترین زیرشاخه های هوش مصنوعی است، در واقع نمونه برداری ساده ای از سیستم عصبی انسان است که در قالب یک مدل ریاضی متبلور شده است. ساختار به شدت موازی مغز انسان که در آن واحد پردازش کوچک به نام نرون در ارتباطاتی تناتنگ، محاسبات بشدت پیچیده ای همچون پردازش تصویر را در کسری از ثانیه انجام می دهد، متخصصین علوم مختلف را تهیج کرد تا از این توانایی در پردازش اطلاعات استفاده کنند. شبکه های عصبی مصنوعی دارای ویژگی هایی می باشند که آنها را در برخی از کاربردها مانند تخمین توابع، پیش بینی، تشخیص الگو، کنترل، رباتیک و به طور کلی در هر جا که نیاز به یادگیری یک نگاشت خطی و یا غیر خطی باشد، ممتاز می نماید. از جمله این ویژگی ها می توان به قابلیت یادگیری، قابلیت تعمیم، پردازش موازی و مقاوم بودن، اشاره نمود. تنوع مدل های شبکه های عصبی و الگوریتم های یادگیری آنها، امکان کاربردهای مختلفی را برای آنها فراهم می آورد ، هر شبکه عصبی مصنوعی و یا به اختصار شبکه عصبی، مشتمل بر مجموعه ای از اجزاء کوچک داده پردازی به نام نرون مصنوعی و یا نرون است که هر نرون به نرون های دیگر از طریق یک رابطه جهت دار که دارای وزن مختص بخود است، مرتبط می گردد. وزن این ارتباطات نشان دهنده اطلاعات موردنیاز شبکه برای حل مسئله هستند.
مفروضات زیر در شبکه های عصبی مصنوعی مورد توجه قرار می گیرند:
-فرایند پردازش اطلاعات در واحدهای ساده ای به نام نرون صورت می گیرد. این نرون ها، در حقیقت نمونه ای بسیار ساده از نرون های مغزی اند.
-اطلاعات در مسیرهای ارتباطی بین نرون ها رد و بدل می شوند.
-هر کدام از خطوط ارتباطی بین نرون ها داراری وزن هستند.
-هر نرون از یک تابع عملیاتی(معمولا غیرخطی) استفاده می کند، تا با اعمال آن روی ورودی نرون (مجموع اطلاعات وزن دار شده)، خروجی مشخصی ایجاد کند
شبکه های عصبی را می توان در موارد گوناگونی از جمله ذخیره کردن و بازبینی داده ها، گروه بندی شکل ها، انجام یک نگاشت کلی از یک مجموعه ورودی به یک مجموعه خروجی، گروه بندی و طبقه-بندی داده های مشابه، بهینه سازی و پیش بینی استفاده کرد. شبکه های عصبی، همانند رگرسیون، ابزاری برای تقریب توابع و یافتن ارتباط میان متغیرهای مستقل و وابسته است. مهمترین تفاوت میان شبکه های عصبی و رویکردهای سنتی آماری، در تقریب توابع آنها است که شبکه های عصبی بر خلاف روش های سنتی آماری هیچ پیش فرضی در مورد توزیع و یا خواص آماری داده ها به عمل نمی آورند و از این نظر می توانند در عمل کارآیی زیادی داشته باشند. ضمن آنکه این شبکه ها، در زمره رویکردهای غیرخطی در تدوین مدل ها قرار دارند و از این منظر نیز در مواجهه با داده هایی که پیچیده و غیرخطی هستند، با دقت بیشتری می توانند آنها را در قالب یک مدل مشخص بیان کنند . شبکه عصبی توسط الگوی ارتباطی بین لایه های مختلف شبکه، تعداد نرون ها، تعداد لایه ها، الگوریتم یادگیری و تابع عملیاتی نرون، شناسایی و تعریف می شود. امّا یک قانون کلی درباره اندازه استاندارد این مؤلفه ها برای هر شبکه و در هر کاربردی وجود ندارد. در بیشتر موارد یک روش ابتکاری است که در آن شبکه های چند لایه با تعداد نرون های متقاوت در هر لایه، نرخ های یادگیری متفاوت و توابع فعال سازی گوناگون آموزش می بینند و سپس بهترین شبکه انتخاب می شود.