MINISTERO
DELL'UNIVERSITÀ
E DELLA RICERCA |
|
Programmi di ricerca cofinanziati - Modello C
Rendiconto di unita' di ricerca - ANNO 2004
prot. 2004012559_004
1.
Area Scientifico Disciplinare principale |
01: Scienze matematiche e informatiche |
2.
Coordinatore Scientifico del programma di ricerca |
BRUGNANO Luigi |
-
Università |
Università degli Studi di FIRENZE |
-
Facoltà |
Facoltà di SCIENZE MATEMATICHE FISICHE
e NATURALI |
-
Dipartimento/Istituto |
Dip. MATEMATICA |
3.
Titolo del programma di ricerca |
Metodi numerici e software matematico per le
applicazioni |
4.
Responsabile Scientifico dell'Unità di Ricerca |
GALLIGANI Emanuele |
-
Università |
Università degli Studi di MODENA e
REGGIO EMILIA |
-
Facoltà |
Facoltà di INGEGNERIA |
-
Dipartimento/Istituto |
Dip. MATEMATICA PURA E APPLICATA |
5.
TITOLO del programma dell'unità di ricerca |
Sistemi di equazioni non lineari e problemi di
programmazione non lineare: metodi e software matematico. |
6.
SETTORE principale dell'unità di ricerca: |
MAT/08 |
7.
Finanziamenti assegnati all'unità di ricerca: |
|
-
Quota Ateneo |
16.800 € |
-
Quota MIUR |
39.000 € |
-
Finanziamento totale |
55.800 € |
8. Descrizione della Ricerca eseguita e dei
risultati ottenuti
L’attività di ricerca
dell’unità operativa di Modena
nell’ambito del progetto, ha riguardato lo sviluppo e la costruzione di
software che hanno come nucleo computazionale i metodi di
ottimizzazione in problemi di apprendimento automatico e di controllo
ottimo, l'analisi e lo sviluppo di metodi numerici per la risoluzione
di classi di sistemi di equazioni non lineari e metodi di
approssimazione numerica di problemi differenziali in biologia
computazionale.
Questa attività è riassunta da oltre una trentina di
lavori su riviste
nazionali e internazionali e rapporti tecnici, dallo sviluppo di codici
per problemi di ottimizzazione in apprendimento statistico e in
controllo ottimo (nella sezione “prodotti della ricerca eseguita” sono
riportate in elenco alcune tra le pubblicazioni) ed anche da
comunicazioni presentate a convegni nazionali ed internazionali (in
fondo a questa sezione di descrizione della ricerca si riporta un
elenco delle conferenze a cui componenti dell'unità di ricerca
hanno
partecipato sui temi del progetto).
Per ciò che concerne problemi di apprendimento statistico, in
particolare in problemi di classificazione e di regressione, è
stato
introdotto un software parallelo, oltre ad un aggiornamento della
versione seriale precedentemente proposta, per macchine a vettori di
supporto (SVM) lineari e non lineari [Z, SZZ1, SZZ2, SZ, PZZ].
Il software implementa, su architetture di calcolo parallele, una
procedura iterativa di decomposizione che include recenti sviluppi
teorici dei metodi tipo-gradiente proiettato usati per la risoluzione
dei sottoproblemi di ottimizzazione quadratica che intervengono ad ogni
iterazione; inoltre sono state introdotte nuove procedure parallele per
l’aggiornamento del gradiente e per la selezione dell’insieme attivo.
La versione del software resa disponibile nel luglio 2006 [SZZ1] ha
consentito di sfruttare architetture parallele per addestrare SVM su
insiemi costituiti da milioni di esempi, superando i limiti dei
tradizionali software seriali.
Il software prodotto è disponibile al sito web sotto licenza GNU
(General Public License) http://www.dm.unife.it/gpdt/ (per il codice
parallelo, sono stati registrati nel database oltre 50 utenti, 4
soggetti commerciali, due pacchetti software per i quali è stato
richiesto di usare il codice PGPDT come core del sistema (uno dei quali
è http://www2.fml.tuebingen.mpg.de/raetsch/projects/shogun); nel
solo
mese di agosto 2006, dopo l’uscita del lavoro [SZZ1], sono stati
registrati oltre 370 accessi al sito, la quasi totalità
dall’estero).
Sempre nell’ambito dei problemi di apprendimento di dimensioni molto
grandi, si è iniziato lo studio di nuovi algoritmi, chiamati
“algoritmi
a cascata”, che si basano su particolari strategie di suddivisione
dell’insieme di addestramento e si prestano ad essere combinati con la
tecnica di decomposizione utilizzata dal metodo PGPDT.
Inoltre, sono state analizzate anche metodologie di apprendimento
derivanti da recenti risultati sulla riformulazione dei problemi di
apprendimento statistico come problemi inversi.
Gli algoritmi di apprendimento automatico sviluppati sono stati
utilizzati dall’unità operativa di Modena in varie applicazioni
reali
in ambito Biochimico (problemi di classificazione automatica dei siti
di interazioni di proteine) e nell’ambito delle Neuroscienze (problemi
di regressione non lineare nell’interpretazione dell’attività
del
cervello). In questo contesto si inserisce l’organizzazione della
Seconda Scuola Internazionale di Computational Cell Biology
“Computational methods in multiscale processes for protein
interactions”, Modena, 4-6 settembre 2006
http://www.dm.unife.it/SCCB2006/, e l’attività per la Scuola di
Dottorato di Ricerca dell’Università di Modena e Reggio Emilia
in
modellistica, simulazione computazionale e caratterizzazione multiscala
per le scienze dei materiali e della vita.
Nell’ambito della risoluzione numerica di problemi di controllo ottimo
mediante la programmazione matematica [BR, BRT, BGR1, BGR2], sono stati
sviluppati diversi risolutori interni per il metodo iterativo di Newton
del punto interno; si riconoscono tra questi, il metodo dei
moltiplicatori e due versioni distinte dei gradienti coniugati
precondizionati. Alcuni tra questi risolutori hanno come nucleo
computazionale la risoluzione del “sistema aumentato” mediante una
fattorizzazione tipo-Cholesky. A questo proposito, è stata
introdotta
una routine BLKFCLT (disponibile al sito web:
http://www.dm.unife.it/blkfclt/ ) per la risoluzione di sistemi sparsi
senza struttura, di grandi dimensioni, simmetrici, indefiniti, che si
basa su una variante della routine LIPSOL di Ng-Peyton.
Questa routine introdotta risulta molto efficiente e contribuisce a
rendere l’approccio di Newton del punto interno estremamente
competitivo con il software di ottimizzazione non lineare esistente
specialmente per problemi di controllo ottimo di tipo ellittico con
equazione differenziale debolmente non lineare. In questi casi vengono
risolti problemi di ottimizzazione nonlineare, sparsi con circa un
milione e mezzo di variabili primali e duali. Il codice del metodo di
Newton del punto interno sviluppato in linguaggio C++ con interfaccia
AMPL che utilizza la routine BLKFCLT è disponibile al sito web
http://www.dm.unife.it/~bonettini/ip_pcg.htm
Inoltre, al sito web
http://www.dm.unife.it/~bonettini/ip_pcg/controllo.htm è
disponibile un
test-set di problemi di controllo ottimo di tipo ellittico e di tipo
parabolico con vincoli sia sullo stato che sul controllo descritti
mediante modelli AMPL.
Un altro aspetto dell’attività dell’unità operativa di
Modena riguarda
l’analisi e lo sviluppo di metodi per sistemi di equazioni non lineari.
Per sistemi di equazioni non lineari semismooth [BT, RT] è stato
introdotto un metodo di Newton inesatto non monotono che risulta
particolarmente interessante quando il risolutore interno è un
metodo
iterativo. La risoluzione numerica di disequazioni variazionali di
grandi dimensioni può essere ottenuta da una generalizzazione di
un
metodo di Newton inesatto applicato a sistemi non lineari semismooth;
è
stato introdotto un precondizionatore, variante della fattorizzazione
LU incompleta, per il metodo iterativo che calcola la soluzione
approssimata ad ogni passo del metodo di Newton inesatto.
Per sistemi di equazioni non lineari alle differenze finite [G1, G2]
sono state analizzate due classi di problemi: nel primo caso, dove il
sistema è debolmente non lineare e la parte non lineare soddisfa
una
proprietà di invarianza affine, sono forniti risultati di
convergenza
per il metodo di Newton e per il metodo di Newton-iterativo e, in
particolare il metodo della Media Aritmetica è stato valutato
numericamente su questa classe di problemi come risolutore iterativo
interno. Nel secondo caso per una classe di sistemi non lineari, come
quelli provenienti dalla discretizzazione di equazioni non lineari di
diffusione-convezione con condizioni di Neumann al contorno, sono stati
introdotti e ne è stata sviluppata una teoria della convergenza,
un
metodo della Media Aritmetica non lineare e un metodo della Media
Aritmetica del punto fisso.
Un aspetto rilevante nella ricerca dell’unità di Modena riguarda
alcune
problematiche di biologia computazionale, come la modellizzazione di
reti di regolazione genica. In questo ambito si inserisce
l’organizzazione della Prima Scuola Internazionale di Computational
Cell Biology “The role of stochasticity in the modelling and simulation
of biological processes”, Urbino, 7-9 novembre 2005
http://www.dm.unife.it/SCCB2005/ . Negli studi a tale riguardo [C1, C2,
C3, C4] sono stati sviluppati metodi adatti all'approssimazione
numerica della soluzione di equazioni differenziali stocastiche con
ritardo e, nel caso deterministico, si è inoltre sviluppato un
software
per la ricerca dei punti di switch di stabilità per equazioni
differenziali con ritardo, discreto o distribuito, aventi equazioni
caratteristiche con coefficienti, sia dipendenti che indipendenti dal
ritardo.
Elenco delle comunicazioni presentate a conferenze:
1) Zanghirati G. (con T. Serafini, L. Zanni): On gradient
projection-based decomposition techniques for training SVMs on parallel
architectures, PASCAL Workshop, Thurnau (Germania), 16-18 marzo, 2005.
2) Zanghirati G. (con T. Serafini, L. Zanni): Numerical Topics on SVMs
Classification, workshop ASTAA Project Meeting 2005, Genova , 9-10
maggio, 2005.
3) Zanghirati G. (con T. Serafini, L. Zanni): Decomposition techniques
and gradient projection methods in training Support Vector Machines,
SIAM Conference on Optimization 2005, Stoccolma, Svezia, 15-19 maggio,
2005.
4) Carletti M.: Numerical simulation of a stochastic model for
bacteriophage infection with time delays, SciCADE05 International
Conference, Nagoya (Giappone), 23-27 maggio 2005.
5) Zanghirati G. (con T. Serafini, L. Zanni): Some Improvements to a
Parallel Decomposition Technique for Training Support Vector Machines,
EURO PVM MPI 2005, 12th European Parallel Virtual Machine and Message
Passing Interface Conference, Sorrento, 18-21 settembre, 2005.
6) Zanghirati G. (con E. Galligani, V. Ruggiero): Splitting methods for
nonlinear diffusion filtering, 3rd IASC World Conference on
Computational Statistics and Data Analysis, Limassol (Cipro), 28-31
ottobre, 2005.
7) Zanghirati G. (con T. Serafini, L. Zanni): Gradient Projection-Type
Quadratic Solvers in Parallel Decomposition Techniques for Support
Vector Machines, 3rd IASC World Conference on Computational Statistics
and Data Analysis, Limassol (Cipro), 28-31 ottobre, 2005.
8) Zanghirati G.: On gradient projection-based and other techniques for
SVMs training, Dipartimento di Matematica, CAU, 13 gennaio 2006
(durante il periodo di professore visitatore presso il China
Agricultural University, Pechino (Cina) dal prof. Nai-Yang Deng, 11-18
gennaio 2006).
9) Bonettini S.,:On the solution of indefinite systems arising in
nonlinear optimization, Conferenza Nazionale SIMAI 2006, Baia Samuele,
25 Maggio 2006.
10) Tinti F.: A preconditioner for solving large scale variational
inequality problems, Conferenza Nazionale SIMAI 2006, Baia Samuele, 25
Maggio 2006.
11) Carletti M.:Stochastic delay differential equations in
biomathematical modelling, Workshop on Innovative Methods for
Evolutionary Problems with Memory, Capri, 19-21 giugno 2006.
12) Zanghirati G.(con L. Zanni): Some properties of gradient-based
methods with application to machine learning, EuroXXI - 21st European
Conference on Operational Research, Reykjavik, Islanda, 2-5 luglio,
2006.
13) Zanni L. (con G. Zanghirati): Large-scale Support Vector Machines:
Decomposition and Cascade Approaches, EuroXXI - 21st European
Conference on Operational Research, Reykjavik, Islanda, 2-5 luglio,
2006.
9. Pubblicazioni
del responsabile
nº |
Pubblicazione |
1. |
GALLIGANI E.; BONETTINI S; RUGGIERO V (2006). Inner
solvers for interior point methods for large scale nonlinear programming
COMPUTATIONAL OPTIMIZATION AND APPLICATIONS ISSN:
0926-6003 accettato per la pubblicazione (marzo 2006) |
2. |
GALLIGANI E. (2006). The Arithmetic Mean
method for solving systems of nonlinear equations in finite differences
APPLIED MATHEMATICS AND COMPUTATION vol. 181 pp. 579-597
ISSN: 0096-3003 |
3. |
GALLIGANI E.; BONETTINI S; RUGGIERO V (2005). An
inexact Newton method combined with Hestenes multipliers' scheme for
the solution of Karush-Kuhn-Tucker systems
APPLIED MATHEMATICS AND COMPUTATION vol. 168 pp. 651-676
ISSN: 0096-3003 |
4. |
GALLIGANI E. (2005). On solving a special
class of weakly nonlinear finite difference systems
INTERNATIONAL JOURNAL OF COMPUTER MATHEMATICS ISSN:
0020-7160 sottomesso per la pubblicazione |
5. |
GALLIGANI E.; BONETTINI S; RUGGIERO V (2004). Hestenes
method for symmetric indefinite systems in Interior-Point method
RENDICONTI DI MATEMATICA E DELLE SUE APPLICAZIONI vol. 24
(Ser. VII) pp. 185-199 ISSN: 1120-7183 |
dei partecipanti
1. |
L. Zanni; 2006; An improved gradient
projection-based decomposition technique for support vector machines;
Rivista: Computational Management Science; Volume: 3; pp.: 131-145;
ISBN: 1619-697X |
2. |
L. Zanni, T. Serafini, G. Zanghirati; 2006;
Parallel
software for training large scale support vector machines on
multiprocessor systems; Rivista: Journal of Machine Learning Research;
Volume: 7; pp.: 1467-1492; ISBN: 1532-4435 |
3. |
M. Carletti; 2006; Numerical simulation of a
Campbell-like stochastic delay model for bacteriophage infection;
Rivista: IMA Journal in Mathematics Applied to Medicine and Biology;
Volume: 23; pp.: 297-310; ISBN: 1477-8599 |
4. |
S. Bonettini, V. Ruggiero; 2006; Some
iterative
methods for the solution of a symmetric indefinite KKT systems;
Rivista: Computational Optimization and Applications; ISBN: 0926-6003;
accettato per la pubblicazione 2006 |
5. |
V. Ruggiero, F. Tinti; 2006; A preconditioner
for
solving large scale variational inequality problems using a semismooth
inexact approach; Rivista: International Journal of Computer
Mathematics; ISBN: 0020-7160; accettato per la pubblicazione 2006 |
10. Prodotti della Ricerca eseguita
Pubblicazioni su riviste
internazionali:
[BR] S. Bonettini, V. Ruggiero: Some iterative methods for the solution
of a symmetric indefinite KKT systems, accettato su Comput. Optim.
Appl., 2006.
[BRT] S. Bonettini, V. Ruggiero, F. Tinti: On the solution of
indefinite systems arising in nonlinear optimization, sottomesso 2006.
[BT] S. Bonettini, F. Tinti: A nonmonotone semismooth inexact Newton
method, Optim. Meth. Software, in stampa 2006.
[RT] V. Ruggiero, F. Tinti: A preconditioner for solving large scale
variational inequality problems by a semismooth inexact approach,
accettato su Intern. J. Computer Math., 2006.
[BGR1] S. Bonettini, E. Galligani, V. Ruggiero: An inexact Newton
method combined with Hestenes multipliers' scheme for the solution of
Karush-Kuhn-Tucker systems, Appl. Math. Comput., 168 (2005), 651-676.
[BGR2] S. Bonettini, E. Galligani, V. Ruggiero: Inner solvers for
interior point methods for large scale nonlinear programming, accettato
su Comput. Optim. Appl., 2006.
[C1] M. Carletti: Numerical solution of stochastic differential
problems in the biosciences, J. Comput. Appl. Math., 185 (2006),
422-440.
[C2] M. Carletti: Numerical simulation of a Campbell-like stochastic
delay model for bacteriophage infection, IMA J. Math. Appl. Medicine
Biology, 23 (2006), 297-310.
[C3] M. Carletti, E. Beretta: Numerical detection of instability
regions for delay moldels with delay-dependent parameters, J. Comput.
Appl. Math., in stampa 2006.
[C4] T. Tian, K. Burrage, P.M. Burrage, M. Carletti: Stochastic delay
differential equations for genetic regulatory networks, J. Comput.
Appl. Math., in stampa 2006.
[FF1] L. Fatone, D. Funaro, G.J. Yoon: A convergence analysis for the
superconsistent Chebyshev method, Appl. Numer. Math., in stampa, 2006.
[FF2] L. Fatone, D. Funaro, R. Giova: Finite-difference schemes for
transport-dominated equations using special collocation nodes, Numer.
Meth Partial Diff. Eqns, 21 (2005), 649-671.
[G1] E. Galligani: The Arithmetic Mean method for solving systems of
nonlinear equations in finite differences, Appl. Math. Comput., 181
(2006), 579-597.
[G2] E. Galligani: On solving a special class of weakly nonlinear
finite difference systems, sottomesso 2005.
[Z] L. Zanni, An improved gradient projection-based decomposition
technique for support vector machines, Comput. Management Science, 3
(2006), 131-145.
[SZZ1] L. Zanni, T. Serafini, G. Zanghirati: Parallel software for
training large scale support vector machines on multiprocessor systems,
J. Machine Learning Res., 7 (2006), 1467-1492.
[SZZ2] T. Serafini, G. Zanghirati, L. Zanni: Gradient projection
methods for quadratic programs and applications in training support
vector machines, Optim. Meth. Software, 20 (2005), 353-378.
[SZ] T. Serafini, L. Zanni: On the working set selection in gradient
projection-based decomposition techniques for support vector machines,
Optim. Meth. Software, 20 (2005), 583-596.
[PZZ] M. Prato, L. Zanni, G. Zanghirati: On recent machine learning
algorithms for brain activity interpretation, sottomesso 2006.
Software sviluppato:
T. Serafini, L. Zanni, G. Zanghirati:
1) Parallel GPDT, Parallel gradient projection-based decomposition
technique, scalar and parallel training of support vector machines.
http://www.dm.unife.it/gpdt/
S. Bonettini, V. Ruggiero:
2) BLKFCLT, Regularized Cholesky-like factorization for sparse
symmetric matrices. http://www.dm.unife.it/blkfclt/
3) IP-PCG, An interior point code for nonlinear constrained
optimization. http://www.dm.unife.it/~bonettini/ip_pcg.htm
4) A collection of optimal control problems.
http://www.dm.unife.it/~bonettini/ip_pcg/controllo.htm
Organizzazione scuole internazionali:
1) M. Carletti, G. Zanghirati, First School on Computational Cell
Biology, Urbino, 7-9 novembre 2005, http://www.dm.unife.it/SCCB2005/
2) M. Carletti, M. Prato, G. Zanghirati, Second School on Computational
Cell Biology, Modena, 4-6 settembre 2006,
http://www.dm.unife.it/SCCB2006/
11. Componenti dell'Unità di ricerca che
hanno effettivamente partecipato alla ricerca
Personale docente
nº |
Cognome |
Nome |
Qualifica |
Facoltà |
Dipartimento/Istituto
Università |
I anno |
II anno |
1. |
CARLETTI |
Margherita |
RU |
SCIENZE e TECNOLOGIE |
Ist. Biomatematica
Univ. URBINO |
3 |
3 |
2. |
FATONE |
Lorella |
RU |
SCIENZE MATEMATICHE FISICHE e NATURALI |
Dip. MATEMATICA PURA E APPLICATA
Univ. MODENA e R. E. |
5 |
4 |
3. |
FUNARO |
Daniele |
PO |
SCIENZE MATEMATICHE FISICHE e NATURALI |
Dip. MATEMATICA PURA E APPLICATA
Univ. MODENA e R. E. |
4 |
4 |
4. |
GALLIGANI |
Emanuele |
PO |
INGEGNERIA |
Dip. MATEMATICA PURA E APPLICATA
Univ. MODENA e R. E. |
6 |
6 |
5. |
RUGGIERO |
Valeria |
PO |
SCIENZE MATEMATICHE FISICHE e NATURALI |
Dip. MATEMATICA
Univ. FERRARA |
5 |
4 |
6. |
ZANGHIRATI |
Gaetano |
RU |
SCIENZE MATEMATICHE FISICHE e NATURALI |
Dip. MATEMATICA
Univ. FERRARA |
7 |
5 |
7. |
ZANNI |
Luca |
PO |
SCIENZE MATEMATICHE FISICHE e NATURALI |
Dip. MATEMATICA PURA E APPLICATA
Univ. MODENA e R. E. |
6 |
3 |
altro personale
nº |
Cognome |
Nome |
Qualifica |
Facoltà |
Dipartimento/Istituto
Università/Ente |
mesi uomo
effettiv. impegnati |
Nota |
I anno |
II anno |
1. |
PRATO |
MARCO |
Assegnista di Ricerca |
|
Dipartimento di Matematica, Università
di Modena e Reggio Emilia |
|
2 |
inserimento nel progetto a partire da
01.11.2006. |
Personale a contratto a carico del PRIN 2004 (escluse le borse di
dottorato)
nº |
Cognome |
Nome |
Qualifica |
Tipologia di contratto |
Inizio del contratto |
Durata
del
contratto
in mesi |
Costo totale
in Euro |
mesi
uomo |
Nota |
I anno |
II anno |
1. |
BONETTINI |
SILVIA |
Dott.ssa |
Assegno di ricerca (D.R.
21.02.2005, Univ. Modena e Reggio E. n. 88) |
01/03/2005 |
12 |
18.074 |
10 |
2 |
|
2. |
TINTI |
FEDERICA |
Dott.ssa |
Assegno di ricerca (D.R.
21.02.2005, Univ. Modena e Reggio E. n. 87) |
01/03/2005 |
12 |
18.075 |
10 |
2 |
|
|
TOTALE |
|
|
|
|
|
36.149 |
|
|
|