✨”𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 ℎ𝑎𝑦 𝑡ℎ𝑜̂́𝑛𝑔 𝑘𝑒̂ 𝑐ℎ𝑎̆́𝑐 ℎ𝑎̆̉𝑛 𝑙𝑎̀ 𝑛ℎ𝑢̛̃𝑛𝑔 𝑘ℎ𝑎́𝑖 𝑛𝑖𝑒̣̂𝑚 𝑘ℎ𝑜̂𝑛𝑔 𝑐𝑜̀𝑛 𝑥𝑎 𝑙𝑎̣ 𝑣𝑜̛́𝑖 𝑡𝑎̂́𝑡 𝑐𝑎̉ 𝑐ℎ𝑢́𝑛𝑔 𝑡𝑎 𝑡𝑟𝑜𝑛𝑔 𝑡ℎ𝑜̛̀𝑖 đ𝑎̣𝑖 𝑘ℎ𝑜𝑎 ℎ𝑜̣𝑐 𝑐𝑜̂𝑛𝑔 𝑛𝑔ℎ𝑒̣̂ 𝑝ℎ𝑎́𝑡 𝑡𝑟𝑖𝑒̂̉𝑛 𝑛ℎ𝑢̛ 𝑛𝑔𝑎̀𝑦 𝑛𝑎𝑦 𝑣𝑎̀ 𝑛ℎ𝑎̂́𝑡 𝑙𝑎̀ 𝑡𝑟𝑜𝑛𝑔 𝑐𝑎́𝑐 𝑙𝑖̃𝑛ℎ 𝑣𝑢̛̣𝑐 𝑙𝑖𝑒̂𝑛 𝑞𝑢𝑎𝑛 𝑑𝑢̛̃ 𝑙𝑖𝑒̣̂𝑢 𝑣𝑖́ 𝑑𝑢̣ 𝑛ℎ𝑢̛ 𝑑𝑎𝑡𝑎 𝑎𝑛𝑎𝑙𝑦𝑠𝑖𝑠, 𝑑𝑎𝑡𝑎 𝑠𝑐𝑖𝑒𝑛𝑐𝑒. 𝑉𝑎̣̂𝑦 𝑔𝑖𝑢̛̃𝑎 𝑡ℎ𝑜̂́𝑛𝑔 𝑘𝑒̂ 𝑣𝑜̛́𝑖 𝑝ℎ𝑎̂𝑛 𝑡𝑖́𝑐ℎ 𝑑𝑢̛̃ 𝑙𝑖𝑒̣̂𝑢 𝑛𝑜́ 𝑐𝑜́ 𝑚𝑜̂́𝑖 𝑙𝑖𝑒̂𝑛 ℎ𝑒̣̂ 𝑐ℎ𝑎̣̆𝑡 𝑐ℎ𝑒̃ 𝑣𝑜̛́𝑖 𝑛ℎ𝑎𝑢 𝑛ℎ𝑢̛ 𝑡ℎ𝑒̂́ 𝑛𝑎̀𝑜? 𝐻𝑜̂𝑚 𝑛𝑎𝑦, ℎ𝑎̃𝑦 𝑐𝑢̀𝑛𝑔 𝑡ℎ𝑎̂̀𝑦 𝐵𝑢̀𝑖 𝐷𝑢̛𝑜̛𝑛𝑔 𝐻𝑎̉𝑖 – 𝑔𝑖𝑎̉𝑛𝑔 𝑣𝑖𝑒̂𝑛 𝐾ℎ𝑜𝑎 𝑇𝑜𝑎́𝑛 𝐾𝑖𝑛ℎ 𝑇𝑒̂́ – 𝑡𝑟𝑢̛𝑜̛̀𝑛𝑔 Đ𝑎̣𝑖 ℎ𝑜̣𝑐 𝐾𝑖𝑛ℎ 𝑡𝑒̂́ 𝑄𝑢𝑜̂́𝑐 𝑑𝑎̂𝑛 𝑔𝑖𝑎̉𝑖 đ𝑎́𝑝 đ𝑢̛𝑜̛̣𝑐 𝑛ℎ𝑢̛̃𝑛𝑔 𝑡ℎ𝑎̆́𝑐 𝑚𝑎̆́𝑐  𝑡𝑟𝑒̂𝑛 𝑞𝑢𝑎 𝑏𝑎̀𝑖 𝑣𝑖𝑒̂́𝑡 𝑠𝑎𝑢 đ𝑎̂𝑦.”

 

 

 

🌊𝐌𝐂: Vâng thưa thầy, chúng ta đều biết thống kê chính là một phần không thể thiếu của phân tích dữ liệu vậy thầy có thể nói rõ hơn về thống kê cũng như tầm quan trọng vai trò của nó đối với phân tích dữ liệu được không ạ?

𝐓𝐡𝐚̂̀𝐲: Dữ liệu (Data) có thể có nhiều dạng: hình ảnh, âm thanh, văn bản, các con số,…, nhưng với thời chuyển đổi số thì toàn bộ dữ liệu đều sẽ được số hóa.

Thống kê, cụ thể hơn là thống kê toán trước hết là làm việc với các đại lượng đo lường, các con số, với tính ngẫu nhiên của hiện tượng. Qua việc chuyển đổi số, thì mọi dữ liệu đều dưới dạng số, và như vậy đều có thể xử lý, phân tích với công cụ thống kê.

Các công cụ phân tích dữ liệu hiện đại, dữ liệu lớn, máy học (machine learning) trước tiên đều phải sử dụng các công cụ thống kê để tính toán các thông số và dự báo, chỉ là phương thức và mô hình khai thác ở mức độ nào.

Do đó, thống kê toán là cơ sở của phân tích dữ liệu hiện đại.

 

🌊𝐌𝐂: Về những công cụ cho phân tích dữ liệu thống kê, theo thầy chúng ta nên sử dụng những phần mềm nào là tốt nhất?

𝐓𝐡𝐚̂̀𝐲: Trong một khảo sát của một số cựu sinh viên KTQD ra trường sau 6 năm tôi từng biết về phần mềm nào dùng nhiều, thì Microsoft Excel vẫn chiếm vị trí hàng đầu. Với phân tích thống kê mô tả với dữ liệu truyền thống, là điều hiện nay vẫn rất cần thiết, thì Excel vẫn rất hiệu quả. Hầu như tất cả những người dùng số liệu bình thường đều sử dụng Excel, nên phần mềm này kết nối được rộng rãi. Hơn nữa Excel cũng có những công cụ mạnh để sử dụng và cho phép lập trình.

Bên cạnh những phần mềm đã phát triển lâu như SPSS, STATA, SAS, MATHLAB, thì gần đây các ngôn ngữ như R, Python được sử dụng phổ biến do khả năng phân tích, tính mở, và khả năng kết nối. Lưu ý đây là hai ngôn ngữ chứ không phải phần mềm.

Trên đây chỉ liệt kê vài phần mềm và ngôn ngữ. Còn thế nào là tốt nhất thì tùy thuộc công việc, lĩnh vực nghiên cứu. Khi nắm được vững gốc lý thuyết thì các bạn có thể học sử dụng các phần mềm, ngôn ngữ một cách linh hoạt, nhanh chóng.

 

🌊𝐌𝐂: Theo thầy, ngày nay đối với các bạn trẻ sinh viên, kỹ năng liên quan đến dữ liệu và phân tích dữ liệu có quan trọng không và vì sao?

𝐓𝐡𝐚̂̀𝐲: Nếu bạn định đi theo cách nghiên cứu và học tập không cần bằng chứng thì có lẽ nó không quan trọng! Còn nếu học tập, nghiên cứu trong kinh tế, kinh doanh, kĩ thuật, xã hội hiện đại mà không dùng đến dữ liệu và thống kê thì tôi không tin là có thể thành công.

Với các đại học danh tiếng ở Âu, Mỹ, các bài tốt nghiệp về kinh tế đều yêu cầu có sử dụng và phân tích dữ liệu. Qua đó thấy rằng sử dụng, phân tích dữ liệu được coi là một phần không thể thiếu trong lĩnh vực này.

Dữ liệu và phân tích dữ liệu không chỉ là một công việc, mà còn là cách chúng ta nhìn vào hiện thực, nhìn vào thế giới xung quanh. Không biết sử dụng, không có kỹ năng phân tích dữ liệu cũng là đóng bớt một cánh cửa bước ra thế giới.

 

🌊𝐌𝐂: Và cuối cùng để kết thúc cho buổi phỏng vấn ngày hôm nay thầy có điều gì muốn gửi tới cuộc thi The Boundless Actuary năm nay không ạ?

𝐓𝐡𝐚̂̀𝐲: Cuộc thi nào rồi cũng kết thúc, chỉ có những gì ta học được, ta làm được trong cuộc thi mới là thứ sẽ cùng đi theo lâu dài và giúp các bạn thành công. Vì vậy, ở vòng thi cuối này thầy chúc các bạn thi sinh sẽ thi đấu hết mình, chúc cho cuộc thi của chúng ta thành công rực rỡ!

 

🌊𝐌𝐂: Em xin chân thành cảm ơn thầy vì những chia sẻ và lời khuyên vô cùng quý báu này ạ.


 

STATISTIC IN DATA PROCESSING

✨”𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑠 𝑖𝑠 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑦 𝑛𝑜𝑡 𝑠𝑜𝑚𝑒𝑡ℎ𝑖𝑛𝑔 𝑢𝑛𝑓𝑎𝑚𝑖𝑙𝑖𝑎𝑟 𝑡𝑜 𝑚𝑜𝑠𝑡 𝑜𝑓 𝑢𝑠 𝑑𝑢𝑟𝑖𝑛𝑔 𝑡ℎ𝑖𝑠 𝑒𝑟𝑎 𝑜𝑓 𝑡𝑒𝑐ℎ𝑛𝑜𝑙𝑜𝑔𝑖𝑐𝑎𝑙 𝑑𝑒𝑣𝑒𝑙𝑜𝑝𝑚𝑒𝑛𝑡, 𝑒𝑠𝑝𝑒𝑐𝑖𝑎𝑙𝑙𝑦 𝑖𝑛 𝑑𝑎𝑡𝑎 𝑟𝑒𝑙𝑎𝑡𝑒𝑑 𝑖𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑒𝑠 𝑠𝑢𝑐ℎ 𝑎𝑠 𝑑𝑎𝑡𝑎 𝑎𝑛𝑎𝑙𝑦𝑠𝑖𝑠 𝑜𝑟 𝑑𝑎𝑡𝑎 𝑠𝑐𝑖𝑒𝑛𝑐𝑒. 𝑆𝑜 𝑤ℎ𝑎𝑡 𝑖𝑠 𝑡ℎ𝑖𝑠 𝑚𝑎𝑔𝑖𝑐𝑎𝑙 𝑏𝑜𝑛𝑑 𝑏𝑒𝑡𝑤𝑒𝑒𝑛 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑠 𝑎𝑛𝑑 𝑑𝑎𝑡𝑎 𝑝𝑟𝑜𝑐𝑒𝑠𝑠𝑖𝑛𝑔? 𝐿𝑒𝑡’𝑠 𝑓𝑖𝑛𝑑 𝑜𝑢𝑡 𝑡ℎ𝑒 𝑎𝑛𝑠𝑤𝑒𝑟 𝑡𝑜 𝑡ℎ𝑒𝑠𝑒 𝑞𝑢𝑒𝑠𝑡𝑖𝑜𝑛𝑠 𝑤𝑖𝑡ℎ 𝑎 𝑙𝑖𝑡𝑡𝑙𝑒 ℎ𝑒𝑙𝑝 𝑓𝑟𝑜𝑚 𝑀𝑟. 𝐵𝑢𝑖 𝐷𝑢𝑜𝑛𝑔 𝐻𝑎𝑖 – 𝑙𝑒𝑐𝑡𝑢𝑟𝑒𝑟 𝑜𝑓 𝑡ℎ𝑒 𝐹𝑎𝑐𝑢𝑙𝑡𝑦 𝑜𝑓 𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐 𝑀𝑎𝑡ℎ𝑒𝑚𝑎𝑡𝑖𝑐𝑠 – 𝑁𝑎𝑡𝑖𝑜𝑛𝑎𝑙 𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑠 𝑈𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑦.”

 

🌊𝐌𝐂: Yes, so we all know that statistics is undoubtedly one of the crucial parts in data processing. Can you tell us more in depth about statistics, as well as why it plays such an important role when it comes to data?

Teacher: Data can be in any form: pictures, sounds, texts, numbers, the list goes on. But in this more modern era, everything would be digitized.

Statistics, more specifically mathematical statistics is, first and foremost, working with measurements, numbers, the stochasticity of events. Through digitalization, every data would appear in number form, and can be processed and analyzed with the help of statistical tools.

Most of the more advanced data analysing tools, big data, machine learning, etc, all have to first use these statistical tools to calculate the parameters and make predictions, it’s just the matter of how and at what level they are doing this task. 

With that being said, mathematical statistics is the basis of modern data processing.

 

🌊𝐌𝐂: What about the tools for statistical data processing, in your opinion, what are our best options?

Teacher: In a survey of graduates from NEU, the program being used the most has to be Microsoft Excel. In statistical analysis of traditional data, which is still very important nowadays, Excel is still doing an “excellent” job. Almost everyone who is working with data on a daily basis uses Excel, so it is also a well-connected program. Furthermore, Excel also has some very incredible tools at its disposal in terms of functionality and development.

Also, beside a few developed programs like SPSS, STATA, SAS, MATHLAB, more recent languages like R and Python are also being used widely due to their analyzing capacity, being open-source, and their ability to connect.

Up there were just a few basic programs and languages. Which is the best, however, is absolutely subjective to each occupation or industry. But when you have the basic knowledge, you can learn other languages and programs in a fast and flexible manner.

 

🌊𝐌𝐂: In your opinion, are skills regarding data and data processing important for students nowadays?

Teacher: Well, if you believe in blindly researching and studying without proves, then maybe they are indeed not that important! However, in modern researching in economics, business, technology, modern social studies, etc., without data and statistics, I don’t think there will be success.

In more prestigious universities in Europe and America, every graduation project in economics requires you to use and analyse data. Through that, we can see that the usage and analysis of data is one of the vital parts in this subject.

Data and data analysis is not just a job, it’s how we look at reality, at the world around us. Not knowing about data analysing skill is then just equivalent to shutting more doors for you to step into the world.

 

🌊𝐌𝐂: Finally, to wrap up this interview, do you have any message for The Boundless Actuary?

Teacher: All contests will have to end, and what we are left with is knowledge we earned from them; those are everlasting, and will help you succeed. With that, in this final round of the competition, I wish all the contestants the best of luck, and a big success for the contest!

 

🌊𝐌𝐂: Thank you so much for spending your time and giving us these extremely beneficial experiences.