“পরিসংখ্যান” একটি বিষয়ের নাম হলেও বর্তমানে এর ব্যবহার ব্যাপক। মূলত ডেটা সায়েন্স,ডেটা এনালিস্ট,মেশিন লার্নিং ইঞ্জিনিয়ারিং থেকে শুরু করে আর্টিফিশিয়াল ইনটিলিজেন্স প্রায় প্রতিটি জায়গায় ই এর ব্যাপক ব্যবহার দেখা যায়। কোনো ডেটাকে এনালাইসিস থেকে শুরু করে ডেটার উপর ভিত্তি করে কোনো প্রেডিকশন করা সবই রয়েছে এই পরিসংখ্যানের মাঝে।যেমন ধরি,আগামীকাল বৃষ্টি হবে নাকি রোদ থাকবে এইধরনের Weather Forecasting থেকে শুরু করে বাজারে কোন প্রোডাক্ট এর চাহিদা কেমন থাকবে সবই যেনো পরিসংখ্যানের হাতে। শুধু তাই নয়,ক্যান্সার থেকে শুরু করে হার্ট এর রোগ প্রেডিকশনেও যেনো পরিসংখ্যান ওতপ্রোতভাবে জড়িয়ে যাচ্ছে।
তাই একজন ভালো ডেটা এনালিস্ট বা মেশিন লার্নিং ইঞ্জিনিয়ার হওয়ার জন্য পরিসংখ্যান খুবই ভালো করে রপ্ত করা জরুরি।পাশাপাশি বিভিন্ন ধরনের ট্যুলস ও সফটওয়্যার নিয়ে আমাদের থাকতে হবে ভালো ধারনা। একজন ভালো মানের ডেটা এনালিস্ট হওয়ার জন্য আমাদের Excel জানাটা জরুরি। Excel দিয়েই প্রায় সকল ধরনের এনালাইসিস করে ফেলা যাবে কিন্তু বর্তমান যুগ প্রতিযোগিতার।নিজেকে প্রোডাক্ট হিসেবে জব মার্কেটে বিক্রি করতে চাইলে আমাদের বিভিন্ন ধরনের ট্যুলস নিয়ে ধারনা থাকতে হবে। এজন্য আমাদেরকে SPSS,STATA নিয়েও ভালো ধারনা রাখতে হবে। এরপর আমরা চাইলে ডেটা ভ্যিজুয়ালাইজেশন এর জন্য Tablue এবং Powerbi শিখে নিতে পারি। তারপর আসি দরকারি কিছু প্রোগ্রামিং এর কাছে যা প্রফেশনাল ডেটা এনালিস্ট হিসেবে নিজেকে পরিচয় দেওয়ার জন্য অতীব জরুরি। সেগুলো হলো Python,R,SQL. আমাদের কে SQl সম্পর্কে ভালোভাবে জানতে হবে। তারপর আমাদেরকে পাইথন অথবা R ব্যবহার করে পূর্ণাংগভাবে ডেটা এনালাইসিস শিখে ফেলতে হবে। এখন আসি কি কি জানা জরুরি।শুরুতে যদি পাইথন দিয়ে শুরু করি তাহলে Python এর Numpy,Pandas,Matplotlib,Seaborn,Scipy লাইব্রেরি শিখে Kaggle এ গিয়ে প্র্যাক্টিস করা যেতে পারে। আর যদি R দিয়ে শুরু করি তবে ডেটা ম্যানিপুলেশনের জন্য dplyr এবং ভ্যিজুয়ালাইজেশন এর জন্য ggplot2 শিখে নিতে পারি। তারপর যদি আরো সামনে আগাতে মন চায় যেমন মেশিন লার্নিং এর দিকে তাহলে আমরা পাইথন এর scikitlearn লাইব্রেরি টি দেখে ফেলতে পারি। এভাবে আগালে হয়ত একদিন পরিসংখ্যানবিদ থেকে নিজেকে ডেটা এনালিস্ট অথবা মেশিন লার্নিং ইঞ্জিনিয়ার হিসেবে পরিচয় দেওয়া যেতে পারে।