Tuy Big Data có nhiều cách định nghĩa khác nhau, nhưng nhìn chung, dữ liệu lớn có 5 đặc trưng cơ bản (mô hình 5V).

1. Khối lượng dữ liệu (Volume)

Dung lượng của Big Data đang tăng lên mạnh mẽ từng ngày. Theo một báo cáo của IDC(International Data Corporation), năm 2011, lượng dữ liệu được tạo ra trên thế giới tăng gần 9 lần chỉ trong vòng 5 năm. Vào tháng 9/2013, Intel đưa ra tài liệu cho rằng cứ mỗi 11 giây, 1 petabyte dữ liệu sẽ được tạo ra trên toàn thế giới, tương đương với một đoạn video HD dài 13 năm.

2. Tốc độ (Velocity)

Với sự ra đời của các kỹ thuật, công cụ, ứng dụng lưu trữ, nguồn dữ liệu lớn liên tục được bổ sung với tốc độ nhanh chóng. Tổ chức McKinsey Global ước tính lượng dữ liệu đang tăng trưởng với tốc độ 40%/năm, và sẽ tăng 44 lần từ năm 2009 đến 2020.

3. Sự đa dạng (Variety)

Sự đa dạng của dữ liệu đến từ nhiều nguồn khác nhau, như từ các thiết bị cảm biến, thiết bị di động, hay thông qua các trang mạng xã hội.

4. Độ tin cậy (Veracity)

Bằng những phương tiện truyền thông xã hội bùng nổ như hiện nay và sự gia tăng mạnh mẽ về tương tác và chia sẻ của người dùng, bức tranh toàn cảnh về độ chính xác cũng như tin cậy của thông tin ngày càng trở nên hỗn loạn và khó khăn. Vấn đề về phân tích và loại bỏ dữ liệu thiếu chính xác đang là một trong những vấn đề lớn của Big Data trong thời đại công nghệ số.

5. Giá trị (Value)

Đây là đặc trưng quan trọng nhất bởi các thông tin đang tiềm ẩn trong bộ dữ liệu khổng lồ được trích xuất để phục vụ cho việc phân tích, dự báo. Những thông tin này có thể được sử dụng trong rất nhiều lĩnh vực như kinh doanh, nghiên cứu khoa học, y học, vật lý,… giúp giải quyết những vấn đề mà cuộc sống hiện đại đặt ra.