Mit „Big Data“ werden sehr große Mengen unstrukturierter Daten bezeichnet. „Unstrukturierte Daten“ sind digitalisierte Informationen, die in einer nicht formalisierten Struktur vorliegen. Man spricht von einer Struktur, wenn die Daten in einer bestimmten Art und Weise angeordnet und verknüpft werden, um den Zugriff auf sie und ihre Verwaltung effizient zu ermöglichen.
Big Data stammen u.a. aus Bereichen wie Internet und Mobilfunk, Finanzindustrie, Energiewirtschaft, Gesundheitswesen und Verkehr sowie aus Quellen wie intelligenten Agenten, sozialen Medien, Kredit- und Kundenkarten, Smart-Metering-Systemen, Assistenzgeräten, Überwachungskameras sowie Flug- und Fahrzeugen.
Big Data sind zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert, um sie mit herkömmlichen Methoden der Datenverarbeitung auszuwerten. Daher kommen neue Arten von Datenspeicher- und Analyse-Systemen zum Einsatz, die parallel auf bis zu Hunderten oder Tausenden von Prozessoren beziehungsweise Servern arbeiten und Methoden der Künstlichen Intelligenz (KI, siehe dort) nutzen.
Anwendungsgebiete sind u.a. die Rasterfahndung, (Inter-)Dependenzanalysen, Umfeld- und Trendforschung sowie System- und Produktionssteuerung. Wie im „Data Mining“ ist Wissensentdeckung das Hauptanliegen. Das weltweite Datenvolumen ist derart angeschwollen, dass bis dato nicht gekannte Möglichkeiten eröffnet werden. Auch die Vernetzung von Datenquellen führt zu neuartigen Nutzungsmöglichkeiten.