I grandi dataset ad alta dimensionalità stanno diventando un campo di ricerca impegnativo. Esistono molte tecniche che deducono le informazioni. Tuttavia, un passo necessario è la riduzione della dimensionalità (DR) delle informazioni.
Il DR può essere eseguito da algoritmi lineari e non lineari. In generale, gli algoritmi lineari sono più veloci a causa del minor carico computazionale. Un problema correlato riguarda i dati ad alta dimkensionalità e variabili nel tempo, in cui la dipendenza dal tempo è dovuta alla distribuzione dei dati non stazionari. Data stream algorithms non sono in grado di proiettare in spazi dimensionali inferiori. Infatti, solo le proiezioni lineari, come l’analisi delle componenti principali (PCA), vengono utilizzate in tempo reale mentre le tecniche non lineari richiedono l’intero database (offline).
La rete neurale Growing Curvilinear Component Analysis (GCCA) affronta questo problema; ha un’architettura incrementale autorganizzata che si adatta alla variazione della distribuzione dei dati ed esegue simultaneamente la quantizzazione e proiezione dei dati utilizzando la CCA, una tecnica di riduzione della distanza non preservata. Ciò si ottiene introducendo l’idea di “seme”, coppia di neuroni che colonizzano il dominio di input e bridge, un nuovo tipo di bordo , che segnala la non stazionarietà dei dati.