doc/html/mpqldec_8f90_source.html

#ifdef SCOREP_USER_ENABLE

#include "scorep/SCOREP_User.inc"

#endif


MODULE mpqldec

    USE mpdef

    IMPLICIT NONE


    INTEGER(mpi) :: npar

    INTEGER(mpi) :: ncon

    INTEGER(mpi) :: nblock

    INTEGER(mpl) :: matsize

    INTEGER(mpi) :: iblock

    INTEGER(mpi) :: monpg

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: matv

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: vecvk

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: matl

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: vecn

    INTEGER(mpi), DIMENSION(:), ALLOCATABLE :: nparblock

    INTEGER(mpi), DIMENSION(:), ALLOCATABLE :: ioffblock

    INTEGER(mpl), DIMENSION(:), ALLOCATABLE :: ioffrow

    INTEGER(mpi), DIMENSION(:), ALLOCATABLE :: ioffpar

    INTEGER(mpi), DIMENSION(:,:), ALLOCATABLE :: irangeparnz


END MODULE mpqldec


SUBROUTINE qlini(n,m,l,s,k)

    USE mpqldec

    USE mpdalc


    IMPLICIT NONE

    INTEGER(mpl) :: length


    INTEGER(mpi), INTENT(IN)          :: n

    INTEGER(mpi), INTENT(IN)          :: m

    INTEGER(mpi), INTENT(IN)          :: l

    INTEGER(mpl), INTENT(IN)          :: s

    INTEGER(mpi), INTENT(IN)          :: k


    npar=n

    ncon=m

    nblock=l

    matsize=s

    iblock=1

    monpg=k

    ! allocate

    length=matsize

    !print *, ' full length (V)', length

    CALL mpalloc(matv,length,'QLDEC: V')

    matv=0.

    length=int(ncon,mpl)*int(ncon,mpl)

    CALL mpalloc(matl,length,'QLDEC: L')

    matl=0.

    length=npar

    CALL mpalloc(vecn,length,'QLDEC: v')

    length=ncon

    CALL mpalloc(vecvk,length,'QLDEC: sec. diag(V)')

    vecvk=0.

    CALL mpalloc(ioffpar,length,'QLDEC: parameter offsets (V)')

    ioffpar=0

    CALL mpalloc(irangeparnz,2_mpl,length,'QLDEC: parameter non zero range (V)')

    length=ncon+1

    CALL mpalloc(ioffrow,length,'QLDEC: row offsets (V)')

    ioffrow=0

    length=nblock

    CALL mpalloc(nparblock,length,'QLDEC: npar in block')

    nparblock=0

    length=nblock+1

    CALL mpalloc(ioffblock,length,'QLDEC: ioff for block')

    ioffblock=0

END SUBROUTINE qlini


!                                                 141217 C. Kleinwort, DESY-FH1

SUBROUTINE qldec(a)

    USE mpqldec

    USE mpdalc


    ! cost[dot ops] ~= Npar*Ncon*Ncon


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpl) :: ioff1

    INTEGER(mpl) :: ioff2

    INTEGER(mpl) :: ioff3

    INTEGER(mpi) :: k

    INTEGER(mpi) :: kn

    INTEGER(mpl) :: length

    REAL(mpd) :: nrm

    REAL(mpd) :: sp


    REAL(mpd), INTENT(IN)             :: a(matsize)


    ! prepare

    vecvk=0._mpd

    length=int(npar,mpl)*int(ncon,mpl)

    matv=a(1:length)

    matl=0.0_mpd

    ! implemented as single block

    nblock=1

    nparblock(1)=npar

    ioffblock(2)=ncon

    DO k=1,ncon

        ioffrow(k+1)=ioffrow(k)+npar

    END DO


    ! Householder procedure

    DO k=ncon,1,-1

        ! monitoring

        IF(monpg>0) CALL monpgs(ncon+1-k)

        kn=npar+k-ncon

        ! column offset

        ioff1=int(k-1,mpl)*int(npar,mpl)

        ! get column

        vecn(1:kn)=matv(ioff1+1:ioff1+kn)

        nrm = sqrt(dot_product(vecn(1:kn),vecn(1:kn)))

        IF (nrm == 0.0_mpd) cycle

        !

        IF (vecn(kn) >= 0.0_mpd) THEN

            vecn(kn)=vecn(kn)+nrm

        ELSE

            vecn(kn)=vecn(kn)-nrm

        END IF

        ! create normal vector

        nrm = sqrt(dot_product(vecn(1:kn),vecn(1:kn)))

        vecn(1:kn)=vecn(1:kn)/nrm

        ! transformation

        ioff2=0

        DO i=1,k

            sp=dot_product(vecn(1:kn),matv(ioff2+1:ioff2+kn))

            matv(ioff2+1:ioff2+kn)=matv(ioff2+1:ioff2+kn)-2.0_mpd*vecn(1:kn)*sp

            ioff2=ioff2+npar

        END DO

        ! store column of L

        ioff3=int(k-1,mpl)*int(ncon,mpl)

        matl(ioff3+k:ioff3+ncon)=matv(ioff1+kn:ioff1+npar)

        ! store normal vector

        matv(ioff1+1:ioff1+kn-1)=vecn(1:kn-1)

        matv(ioff1+kn:ioff1+npar)=0.0_mpd

        irangeparnz(1,k)=1

        irangeparnz(2,k)=kn-1

        ! store secondary diagonal

        vecvk(k)=vecn(kn)

    END DO


END SUBROUTINE qldec


!                                                 190312 C. Kleinwort, DESY-BELLE

SUBROUTINE qldecb(a,bpar,bcon,rcon)

    USE mpqldec

    USE mpdalc


    ! cost[dot ops] ~= Npar*Ncon*Ncon


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: ibcon

    INTEGER(mpi) :: iblast

    INTEGER(mpi) :: iboff

    INTEGER(mpi) :: ibpar

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpi) :: in

    INTEGER(mpl) :: ioff1

    INTEGER(mpl) :: ioff2

    INTEGER(mpl) :: ioff3

    INTEGER(mpi) :: iclast

    INTEGER(mpi) :: icoff

    INTEGER(mpi) :: iplast

    INTEGER(mpi) :: ipoff

    INTEGER(mpi) :: k

    INTEGER(mpi) :: k1

    INTEGER(mpi) :: kn

    INTEGER(mpi) :: ncb

    INTEGER(mpi) :: ncol

    INTEGER(mpi) :: npb

    REAL(mpd) :: nrm

    REAL(mpd) :: sp


    REAL(mpd), INTENT(IN)             :: a(matsize)

    INTEGER(mpi), INTENT(IN)          :: bpar(2,nblock+1)

    INTEGER(mpi), INTENT(IN)          :: bcon(3,ncon+1)

    INTEGER(mpi), INTENT(IN)          :: rcon(4,ncon)


    !$POMP INST BEGIN(qldecb)

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_begin("UR_qldecb", scorep_user_region_type_common)

#endif

    ! prepare

    vecvk=0.0_mpd

    matv=a(1:matsize)

    matl=0.0_mpd


    ! prepare offsets

    icoff=0

    DO ibpar=1,nblock ! parameter block

        iclast=icoff

        DO ibcon=bpar(2,ibpar)+1, bpar(2,ibpar+1)! constraint block

            ncb=bcon(1,ibcon+1)-bcon(1,ibcon) ! number of constraints in constraint block

            npb=bcon(3,ibcon)+1-bcon(2,ibcon) ! number of parameters in constraint block

            ifirst=bcon(2,ibcon)

            ilast=bcon(3,ibcon)

            DO i=bcon(1,ibcon),bcon(1,ibcon+1)-1

                ! non-zero range: first, last parameter

                irangeparnz(1,i)=rcon(1,i)

                irangeparnz(2,i)=rcon(2,i)

                ! storage: parameter, row offset

                ioffpar(i)=rcon(3,i)-1

                ioffrow(i+1)=ioffrow(i)+rcon(4,i)-ioffpar(i)

            END DO

            iclast=iclast+ncb

        END DO

        ! set up matL

        iblast=bpar(1,ibpar+1) ! last parameter in parameter block

        DO k=icoff+1,iclast

            kn=iblast+k-iclast

            ioff1=ioffrow(k)

            npb=int(ioffrow(k+1)-ioff1,mpi)

            ! size of overlap

            ncol=ioffpar(k)+npb-kn

            IF (ncol >= 0) THEN

                ioff3=int(k-1,mpl)*int(ncon,mpl)

                matl(ioff3+iclast-ncol-icoff:ioff3+iclast-icoff)=matv(ioff1+npb-ncol:ioff1+npb)

            END IF

        END DO

        icoff=iclast

        nparblock(ibpar)=bpar(1,ibpar+1)-bpar(1,ibpar)

        ioffblock(ibpar+1)=icoff

    END DO


    DO ibpar=1,nblock ! parameter block

        iboff=bpar(1,ibpar)    ! last offset in parameter block

        iblast=bpar(1,ibpar+1) ! last parameter in parameter block

        icoff=ioffblock(ibpar) ! constraint offset in parameter block

        iclast=ioffblock(ibpar+1) ! last constraint in parameter block

        IF(iclast <= icoff) cycle ! no constraints

        ibcon=bpar(2,ibpar+1) ! start with last constraint block

        k1=bcon(1,ibcon) ! first constraint in block

        ! Householder procedure

        DO k=iclast,icoff+1,-1

            ! monitoring

            IF(monpg>0) CALL monpgs(ncon+1-k)

            kn=iblast+k-iclast

            ! different constraint block?

            IF (k < k1) THEN

                ibcon=ibcon-1

                k1=bcon(1,ibcon)

            END IF

            ! parameter offset

            ipoff=ioffpar(k)

            ! index if first non-zero parameter

            ifirst=ipoff+1

            IF (ifirst > kn) cycle

            ! column offset

            ioff1=ioffrow(k)

            ! number of parameter

            npb=int(ioffrow(k+1)-ioff1,mpi)

            ! index of last parameter

            iplast=ioffpar(k)+npb

            ! index of last used parameter

            ilast=min(iplast,kn)

            ! number of used columns

            ncol=ilast-ipoff

            ! get column

            in=iblast+k1-iclast

            vecn(in:kn)=0.0_mpd

            vecn(ifirst:ilast)=matv(ioff1+1:ioff1+ncol)

            nrm = sqrt(dot_product(vecn(ifirst:ilast),vecn(ifirst:ilast)))

            IF (nrm == 0.0_mpd) cycle

            !

            IF (vecn(kn) >= 0.0_mpd) THEN

                vecn(kn)=vecn(kn)+nrm

            ELSE

                vecn(kn)=vecn(kn)-nrm

            END IF

            ! create normal vector

            IF (ilast < kn) THEN

                nrm = sqrt(dot_product(vecn(ifirst:ilast),vecn(ifirst:ilast))+vecn(kn)*vecn(kn))

                vecn(ifirst:ilast)=vecn(ifirst:ilast)/nrm

                vecn(kn)=vecn(kn)/nrm

            ELSE

                nrm = sqrt(dot_product(vecn(ifirst:ilast),vecn(ifirst:ilast)))

                vecn(ifirst:ilast)=vecn(ifirst:ilast)/nrm

            END IF

            ! update L too

            ioff3=int(k1-2,mpl)*int(ncon,mpl)

            ! transformation

            DO i=k1,k

                ioff3=ioff3+ncon

                IF (irangeparnz(1,k) > irangeparnz(2,i)) cycle ! no overlap

                ioff2=ioffrow(i)+ioffpar(k)-ioffpar(i)

                sp=dot_product(vecn(ifirst:ilast),matv(ioff2+1:ioff2+ncol))

                IF (sp /= 0.0_mpd) THEN

                    ! update matV

                    matv(ioff2+1:ioff2+ncol)=matv(ioff2+1:ioff2+ncol)-2.0_mpd*vecn(ifirst:ilast)*sp

                    ! update matL

                    in=iblast+i-iclast

                    matl(ioff3+i-icoff:ioff3+k-icoff)=matl(ioff3+i-icoff:ioff3+k-icoff)-2.0_mpd*vecn(in:kn)*sp

                    ! update non zero range

                    irangeparnz(1,i)=min(irangeparnz(1,i),irangeparnz(1,k))

                    irangeparnz(2,i)=max(irangeparnz(2,i),irangeparnz(2,k))

                END IF

            END DO

            ! store secondary diagonal

            vecvk(icoff+k)=vecn(kn)

            ! store normal vector (non zero part)

            ifirst=irangeparnz(1,k)

            ilast=min(irangeparnz(2,k),kn-1)

            ncol=ilast-ifirst+1

            matv(ioff1+1:ioff1+ncol)=vecn(ifirst:ilast)

            matv(ioff1+ncol+1:ioff1+npb)=0.0_mpd

            ! local to parameter block

            irangeparnz(1,k)=ifirst-iboff

            irangeparnz(2,k)=ilast-iboff

        END DO

    END DO

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_end("UR_qldecb")

#endif

    !$POMP INST END(qldecb)


END SUBROUTINE qldecb


SUBROUTINE qlmlq(x,m,t)

    USE mpqldec


    ! cost[dot ops] ~= N*M*Nhr


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: icoff

    INTEGER(mpi) :: iclast

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpl) :: ioff2

    INTEGER(mpi) :: j

    INTEGER(mpi) :: k

    INTEGER(mpi) :: l

    INTEGER(mpi) :: kn

    INTEGER(mpi) :: nconb

    INTEGER(mpi) :: nparb

    REAL(mpd) :: sp


    INTEGER(mpi), INTENT(IN)          :: m

    REAL(mpd), INTENT(IN OUT)         :: x(INT(npar,mpl)*INT(m,mpl))

    LOGICAL, INTENT(IN)               :: t


    icoff=ioffblock(iblock) ! constraint offset in parameter block

    iclast=ioffblock(iblock+1) ! last constraint in parameter block

    nconb=iclast-icoff ! number of constraints in block

    nparb=nparblock(iblock) ! number of parameters in block

    DO j=1,nconb

        k=j

        IF (t) k=nconb+1-j

        kn=nparb+k-nconb

        ! expand row 'l' of matV into vecN

        l=k+icoff

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,l)

        ilast=irangeparnz(2,l)

        vecn(1:nparb)=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(l)+1:ioffrow(l)+1+ilast-ifirst)

        vecn(kn)=vecvk(l)

        ! transformation

        ioff2=0

        DO i=1,m

            sp=dot_product(vecn(ifirst:ilast),x(ioff2+ifirst:ioff2+ilast))+vecn(kn)*x(ioff2+kn)

            x(ioff2+ifirst:ioff2+ilast)=x(ioff2+ifirst:ioff2+ilast)-2.0_mpd*vecn(ifirst:ilast)*sp

            x(ioff2+kn)=x(ioff2+kn)-2.0_mpd*vecn(kn)*sp

            ioff2=ioff2+nparb

        END DO

    END DO


END SUBROUTINE qlmlq


SUBROUTINE qlmrq(x,m,t)

    USE mpqldec


    ! cost[dot ops] ~= N*M*Nhr


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpl) :: iend

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpi) :: j

    INTEGER(mpi) :: k

    INTEGER(mpi) :: kn

    REAL(mpd) :: sp


    INTEGER(mpi), INTENT(IN)          :: m

    REAL(mpd), INTENT(IN OUT)         :: x(INT(m,mpl)*INT(npar,mpl))

    LOGICAL, INTENT(IN)               :: t


    DO j=1,ncon

        k=j

        IF (.not.t) k=ncon+1-j

        kn=npar+k-ncon

        ! expand row 'k' of matV into vecN

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,k)

        ilast=irangeparnz(2,k)

        vecn=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(k)+1:ioffrow(k)+1+ilast-ifirst)

        vecn(kn)=vecvk(k)

        ! transformation

        iend=m*kn

        DO i=1,npar

            sp=dot_product(vecn(1:kn),x(i:iend:m))

            x(i:iend:m)=x(i:iend:m)-2.0_mpd*vecn(1:kn)*sp

        END DO

    END DO


END SUBROUTINE qlmrq


SUBROUTINE qlsmq(x,t)

    USE mpqldec


    ! cost[dot ops] ~= N*N*Nhr


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpl) :: ioff2

    INTEGER(mpl) :: iend

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpi) :: j

    INTEGER(mpi) :: k

    INTEGER(mpi) :: kn

    REAL(mpd) :: sp


    REAL(mpd), INTENT(IN OUT)         :: x(INT(npar,mpl)*INT(npar,mpl))

    LOGICAL, INTENT(IN)               :: t


    DO j=1,ncon

        ! monitoring

        IF(monpg>0) CALL monpgs(j)

        k=j

        IF (t) k=ncon+1-j

        kn=npar+k-ncon

        ! expand row 'k' of matV into vecN

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,k)

        ilast=irangeparnz(2,k)

        vecn=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(k)+1:ioffrow(k)+1+ilast-ifirst)

        vecn(kn)=vecvk(k)

        ! transformation

        iend=int(npar,mpl)*int(kn,mpl)

        DO i=1,npar

            sp=dot_product(vecn(1:kn),x(i:iend:npar))

            x(i:iend:npar)=x(i:iend:npar)-2.0_mpd*vecn(1:kn)*sp

        END DO

        ioff2=0

        DO i=1,npar

            sp=dot_product(vecn(1:kn),x(ioff2+1:ioff2+kn))

            x(ioff2+1:ioff2+kn)=x(ioff2+1:ioff2+kn)-2.0_mpd*vecn(1:kn)*sp

            ioff2=ioff2+npar

        END DO

    END DO


END SUBROUTINE qlsmq


SUBROUTINE qlssq(aprod,A,s,roff,t)

    USE mpqldec

    USE mpdalc


    ! cost[dot ops] ~= N*N*Nhr


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: ibpar

    INTEGER(mpi) :: icoff

    INTEGER(mpi) :: iclast

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpi) :: ilasti

    INTEGER(mpl) :: ioff2

    INTEGER(mpi) :: ioffp

    INTEGER(mpi) :: j

    INTEGER(mpi) :: k

    INTEGER(mpi) :: l

    INTEGER(mpi) :: kn

    INTEGER(mpl) :: length

    INTEGER(mpi) :: nconb

    INTEGER(mpi) :: nparb

    REAL(mpd) :: vtAv

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: Av


    INTEGER(mpl), INTENT(IN)          :: s

    REAL(mpd), INTENT(IN OUT)         :: A(s)

    INTEGER(mpl), INTENT(IN)          :: roff(npar)

    LOGICAL, INTENT(IN)               :: t


    INTERFACE

        SUBROUTINE aprod(n,l,x,is,ie,y) ! y=A*x

            USE mpdef

            INTEGER(mpi), INTENT(in) :: n

            INTEGER(mpl), INTENT(in) :: l

            REAL(mpd), INTENT(IN)    :: x(n)

            INTEGER(mpi), INTENT(in) :: is

            INTEGER(mpi), INTENT(in) :: ie

            REAL(mpd), INTENT(OUT)   :: y(n)

        END SUBROUTINE aprod

    END INTERFACE

    !$POMP INST BEGIN(qlssq)

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_begin("UR_qlssq", scorep_user_region_type_common)

#endif


    length=npar

    CALL mpalloc(av,length,'qlssq: A*v')


    ioffp=0 ! parameter offset for block

    DO ibpar=1,nblock ! parameter block

        icoff=ioffblock(ibpar) ! constraint offset in parameter block

        iclast=ioffblock(ibpar+1) ! last constraint in parameter block

        nconb=iclast-icoff ! number of constraints in block

        nparb=nparblock(ibpar) ! number of parameters in block

        DO j=1,nconb

            k=j

            ! monitoring

            IF(monpg>0) CALL monpgs(icoff+k)

            IF (t) k=nconb+1-j

            kn=nparb+k-nconb

            ! expand row 'l' of matV into vecN

            l=k+icoff

            ! non-zero range (excluding 'kn')

            ifirst=irangeparnz(1,l)

            ilast=irangeparnz(2,l)

            vecn(1:nparb)=0._mpd

            vecn(ifirst:ilast)=matv(ioffrow(l)+1:ioffrow(l)+1+ilast-ifirst)

            vecn(kn)=vecvk(k)

            ! A*v

            av(1:nparb)=0._mpd

            CALL aprod(nparb,int(ioffp,mpl),vecn(1:nparb),ifirst,ilast,av(1:nparb))

            CALL aprod(nparb,int(ioffp,mpl),vecn(1:nparb),kn,kn,av(1:nparb))

            ! transformation

            ! diagonal block

            ! v^t*A*v

            vtav=dot_product(vecn(ifirst:ilast),av(ifirst:ilast))+vecn(kn)*av(kn)

            ! update

            ! parallelize row loop

            ! slot of 8 'I' for next idle thread

            !$OMP PARALLEL DO &

            !$OMP PRIVATE(IOFF2,ILASTI) &

            !$OMP SCHEDULE(DYNAMIC,8)

            DO i=1,kn

                ioff2=roff(i+ioffp)+ioffp

                ilasti=min(ilast,i)

                ! correct with  2*(2v*vtAv*v^t - Av*v^t)

                a(ioff2+ifirst:ioff2+ilasti)=a(ioff2+ifirst:ioff2+ilasti)+2.0_mpd* &

                    ((2.0_mpd*vecn(i)*vtav-av(i))*vecn(ifirst:ilasti))

            END DO

            !$OMP END PARALLEL DO


            ! parallelize row loop

            ! slot of 8 'I' for next idle thread

            !$OMP PARALLEL DO &

            !$OMP PRIVATE(IOFF2) &

            !$OMP SCHEDULE(DYNAMIC,8)

            DO i=ifirst,ilast

                ioff2=roff(i+ioffp)+ioffp

                ! correct with  -2(Av*v^t)^t)

                a(ioff2+1:ioff2+i)=a(ioff2+1:ioff2+i)-2.0_mpd*av(1:i)*vecn(i)

            END DO

            !$OMP END PARALLEL DO

            ! i=kn, add secondary diagonal element

            ioff2=roff(kn+ioffp)+ioffp

            a(ioff2+kn)=a(ioff2+kn)+2.0_mpd*((2.0_mpd*vecvk(l)*vtav-av(kn))*vecvk(l)-av(kn)*vecvk(l))

            ! off diagonal block

            DO i=kn+1,nparb

                ioff2=roff(i+ioffp)+ioffp

                ! correct with -2Av*v^t

                a(ioff2+ifirst:ioff2+ilast)=a(ioff2+ifirst:ioff2+ilast)-2.0_mpd*vecn(ifirst:ilast)*av(i)

                a(ioff2+kn)=a(ioff2+kn)-2.0_mpd*vecvk(l)*av(i)

            END DO

        END DO

        ! update parameter offset

        ioffp=ioffp+nparb

    END DO


    CALL mpdealloc(av)

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_end("UR_qlssq")

#endif

    !$POMP INST END(qlssq)


END SUBROUTINE qlssq


SUBROUTINE qlpssq(aprod,B,m,t)

    USE mpqldec

    USE mpdalc


    ! cost[dot ops] ~= N*N*Nhr


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpi) :: ifirst2

    INTEGER(mpi) :: ilast2

    INTEGER(mpl) :: ioff1

    INTEGER(mpl) :: ioff2

    INTEGER(mpi) :: istat(3)

    INTEGER(mpi) :: j

    INTEGER(mpi) :: j2

    INTEGER(mpi) :: k

    INTEGER(mpi) :: k2

    INTEGER(mpi) :: kn

    INTEGER(mpi) :: kn2

    INTEGER(mpi) :: l

    INTEGER(mpi) :: l1

    INTEGER(mpi) :: l2

    INTEGER(mpl) :: length

    INTEGER(mpi) :: mbnd

    REAL(mpd) :: v2kn

    REAL(mpd) :: vtAv

    REAL(mpd) :: vtAvp

    REAL(mpd) :: vtvp

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: vecAv    ! A*v

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: matvtvp  ! v^t*v'

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: matvtAvp ! v^t*(A*v')

    REAL(mpd), DIMENSION(:), ALLOCATABLE :: matCoeff ! coefficients (d(A*v)=sum(c_i*v_i))

    INTEGER(mpi), DIMENSION(:,:), ALLOCATABLE :: irangeCoeff


    INTEGER(mpi), INTENT(IN)          :: m

    REAL(mpd), INTENT(IN OUT)         :: B(npar*m-(m*m-m)/2)

    LOGICAL, INTENT(IN)               :: t


    INTERFACE

        SUBROUTINE aprod(n,l,x,is,ie,y) ! y=A*x

            USE mpdef

            INTEGER(mpi), INTENT(in) :: n

            INTEGER(mpl), INTENT(in) :: l

            REAL(mpd), INTENT(IN)    :: x(n)

            INTEGER(mpi), INTENT(in) :: is

            INTEGER(mpi), INTENT(in) :: ie

            REAL(mpd), INTENT(OUT)   :: y(n)

        END SUBROUTINE aprod

    END INTERFACE

    !$POMP INST BEGIN(qlpssq)

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_begin("UR_qlpssq", scorep_user_region_type_common)

#endif


    length=npar

    CALL mpalloc(vecav,length,'qlpssq: A*v')

    length=int(ncon,mpl)*int(ncon,mpl)

    CALL mpalloc(matvtvp,length,"qlpssq: v^t*v'")

    matvtvp=0._mpd

    CALL mpalloc(matvtavp,length,"qlpssq: v^t*(A*v')")

    matvtavp=0._mpd

    CALL mpalloc(matcoeff,length,'qlpssq: coefficients')

    matcoeff=0._mpd

    length=ncon

    CALL mpalloc(irangecoeff,2_mpl,length,'qlpssq: non zero coefficient range')


    mbnd=max(0,m-1) ! band width without diagonal


    DO j=1,ncon

        k=j

        ! monitoring

        IF(monpg>0) CALL monpgs(k)

        IF (t) k=ncon+1-j

        kn=npar+k-ncon

        ioff1=int(k-1,mpl)*int(ncon,mpl)

        irangecoeff(1,k)=ncon

        irangecoeff(2,k)=1

        ! expand row 'k' of matV into vecN

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,k)

        ilast=irangeparnz(2,k)

        vecn=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(k)+1:ioffrow(k)+1+ilast-ifirst)

        vecn(kn)=vecvk(k)

        ! transformation A*v

        vecav(1:npar)=0._mpd

        CALL aprod(npar,0_mpl,vecn(1:npar),ifirst,ilast,vecav(1:npar))

        CALL aprod(npar,0_mpl,vecn(1:npar),kn,kn,vecav(1:npar))

        ! products v^t*v'

        DO j2=j+1,ncon

            k2=j2

            IF (t) k2=ncon+1-j2

            kn2=npar+k2-ncon

            ioff2=int(k2-1,mpl)*int(ncon,mpl)

            ! non-zero range (excluding 'kn')

            ifirst2=irangeparnz(1,k2)

            ilast2=irangeparnz(2,k2)

            v2kn=0._mpd

            IF (kn >= ifirst2.AND.kn <= ilast2) v2kn=matv(ioffrow(k2)+1+kn-ifirst2)

            ! overlap regions

            l1=max(ifirst,ifirst2)

            l2=min(ilast,ilast2)

            vtvp=vecn(kn2)*vecvk(k2)+vecn(kn)*v2kn ! v^t*v'

            IF (l1 <= l2) vtvp=vtvp+dot_product(vecn(l1:l2), &

                matv(ioffrow(k2)+1+l1-ifirst2:ioffrow(k2)+1+l2-ifirst2))

            ! significant term?

            IF (abs(vtvp) > 16.0_mpd*epsilon(vtvp)) THEN

                matvtvp(ioff1+k2)=vtvp

                matvtvp(ioff2+k)=vtvp

            END IF

        END DO

        matvtvp(ioff1+k)=1.0_mpd

        ! products v^t*(A*v')

        DO j2=1,j

            k2=j2

            IF (t) k2=ncon+1-j2

            kn2=npar+k2-ncon

            ! non-zero range (excluding 'kn')

            ifirst2=irangeparnz(1,k2)

            ilast2=irangeparnz(2,k2)

            ! non-zero regions

            matvtavp(ioff1+k2)=vecvk(k2)*vecav(kn2)+dot_product(vecav(ifirst2:ilast2), &

                matv(ioffrow(k2)+1:ioffrow(k2)+1+ilast2-ifirst2)) ! v'^t*(A*v)

        END DO

        ! update with (initial) A*v

        ioff2=0

        vtav=matvtavp(ioff1+k)

        DO i=1,kn

            ! correct with  2*(2v*vtAv*v^t - Av*v^t - (Av*v^t)^t)

            DO l=max(1,i-mbnd),i

                ioff2=ioff2+1

                b(ioff2)=b(ioff2)+2.0_mpd*((2.0_mpd*vecn(i)*vtav-vecav(i))*vecn(l)-vecav(l)*vecn(i))

            END DO

        END DO

        ! off diagonal block

        DO i=kn+1,npar

            ! correct with -2Av*v^t

            DO l=max(1,i-mbnd),i

                ioff2=ioff2+1

                b(ioff2)=b(ioff2)-2.0_mpd*vecav(i)*vecn(l)

            END DO

        END DO

    END DO


    ! corrections for A*v (as linear combination of v's)

    DO j=1,ncon

        k=j

        IF (t) k=ncon+1-j

        kn=npar+k-ncon

        ioff1=int(k-1,mpl)*int(ncon,mpl)

        ! expand row 'k' of matV into vecN

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,k)

        ilast=irangeparnz(2,k)

        vecn=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(k)+1:ioffrow(k)+1+ilast-ifirst)

        vecn(kn)=vecvk(k)

        ! transformation (diagonal block)

        l1=irangecoeff(1,k)

        l2=irangecoeff(2,k)

        ! diagonal block

        ! v^t*A*v

        vtav=matvtavp(ioff1+k)+dot_product(matcoeff(ioff1+l1:ioff1+l2),matvtvp(ioff1+l1:ioff1+l2))

        ! expand correction to initial A*v

        vecav(1:npar)=0._mpd

        istat=0

        DO k2=l1,l2

            IF (matcoeff(ioff1+k2) == 0._mpd) cycle

            if (istat(1)==0) istat(1)=k2

            istat(2)=k2

            istat(3)=istat(3)+1

            kn2=npar+k2-ncon

            ! expand row 'k2' of matV directly into vecAv

            ! non-zero range (excluding 'kn')

            ifirst2=irangeparnz(1,k2)

            ilast2=irangeparnz(2,k2)

            vecav(ifirst2:ilast2)=vecav(ifirst2:ilast2)+matcoeff(ioff1+k2)* &

                matv(ioffrow(k2)+1:ioffrow(k2)+1+ilast2-ifirst2)

            vecav(kn2)=vecav(kn2)+matcoeff(ioff1+k2)*vecvk(k2)

        END DO

        ! update

        ioff2=0

        DO i=1,kn

            ! correct with  2*(2v*vtAv*v^t - Av*v^t - (Av*v^t)^t)

            DO l=max(1,i-mbnd),i

                ioff2=ioff2+1

                b(ioff2)=b(ioff2)+2.0_mpd*((2.0_mpd*vecn(i)*vtav-vecav(i))*vecn(l)-vecav(l)*vecn(i))

            END DO

        END DO

        ! off diagonal block

        DO i=kn+1,npar

            ! correct with -2Av*v^t

            DO l=max(1,i-mbnd),i

                ioff2=ioff2+1

                b(ioff2)=b(ioff2)-2.0_mpd*vecav(i)*vecn(l)

            END DO

        END DO

        ! correct A*v for the remainung v

        DO j2=j+1,ncon

            k2=j2

            IF (t) k2=ncon+1-j2

            kn2=npar+k2-ncon

            ioff2=int(k2-1,mpl)*int(ncon,mpl)

            vtvp=matvtvp(ioff1+k2) ! v^t*v'

            ! non-zero regions

            l1=irangecoeff(1,k2)

            l2=irangecoeff(2,k2)

            vtavp=matvtavp(ioff2+k)

            IF (l1 <= l2) vtavp=vtavp+dot_product(matcoeff(ioff2+l1:ioff2+l2),matvtvp(ioff1+l1:ioff1+l2)) ! v^t*(A*v')

            l1=min(l1,k)

            l2=max(l2,k)

            matcoeff(ioff2+k)=matcoeff(ioff2+k)+2.0_mpd*(2.0_mpd*vtav*vtvp-vtavp)

            IF (vtvp /= 0._mpd) THEN

                l1=min(l1,irangecoeff(1,k))

                l2=max(l2,irangecoeff(2,k))

                matcoeff(ioff2+l1:ioff2+l2)=matcoeff(ioff2+l1:ioff2+l2)-2.0_mpd*matcoeff(ioff1+l1:ioff1+l2)*vtvp

            END IF

            irangecoeff(1,k2)=l1

            irangecoeff(2,k2)=l2

        END DO

    END DO


    CALL mpdealloc(irangecoeff)

    CALL mpdealloc(matcoeff)

    CALL mpdealloc(matvtavp)

    CALL mpdealloc(matvtvp)

    CALL mpdealloc(vecav)

#ifdef SCOREP_USER_ENABLE

    scorep_user_region_by_name_end("UR_qlpssq")

#endif

    !$POMP INST END(qlpssq)


END SUBROUTINE qlpssq


SUBROUTINE qlgete(emin,emax)

    USE mpqldec


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: ibpar

    INTEGER(mpi) :: icoff

    INTEGER(mpi) :: iclast

    INTEGER(mpl) :: idiag


    REAL(mpd), INTENT(OUT)         :: emin

    REAL(mpd), INTENT(OUT)         :: emax


    emax=matl(1)

    emin=emax

    DO ibpar=1,nblock ! parameter block

        icoff=ioffblock(ibpar) ! constraint offset in parameter block

        iclast=ioffblock(ibpar+1) ! last constraint in parameter block

        idiag=int(ncon,mpl)*int(icoff,mpl)+1

        DO i=icoff+1,iclast

            IF (abs(emax) < abs(matl(idiag))) emax=matl(idiag)

            IF (abs(emin) > abs(matl(idiag))) emin=matl(idiag)

            idiag=idiag+ncon+1

        END DO

    END DO


END SUBROUTINE qlgete


SUBROUTINE qlbsub(d,y)

    USE mpqldec


    IMPLICIT NONE

    INTEGER(mpi) :: icoff

    INTEGER(mpi) :: iclast

    INTEGER(mpl) :: idiag

    INTEGER(mpi) :: k

    INTEGER(mpi) :: nconb


    REAL(mpd), INTENT(IN)         :: d(ncon)

    REAL(mpd), INTENT(OUT)        :: y(ncon)


    ! solve L*y=d by forward substitution

    icoff=ioffblock(iblock) ! constraint offset in parameter block

    iclast=ioffblock(iblock+1) ! last constraint in parameter block

    nconb=iclast-icoff ! number of constraints in block

    idiag=int(ncon,mpl)*int(iclast-1,mpl)+nconb

    DO k=nconb,1,-1

        y(k)=(d(k)-dot_product(matl(idiag+1:idiag+nconb-k),y(k+1:nconb)))/matl(idiag)

        idiag=idiag-ncon-1

    END DO


END SUBROUTINE qlbsub


SUBROUTINE qlsetb(ib)

    USE mpqldec


    IMPLICIT NONE

    INTEGER(mpi), INTENT(IN)      :: ib


    iblock=ib


END SUBROUTINE qlsetb


SUBROUTINE qldump()

    USE mpqldec


    IMPLICIT NONE

    INTEGER(mpi) :: i

    INTEGER(mpi) :: ifirst

    INTEGER(mpi) :: ilast

    INTEGER(mpl) :: ioff1

    INTEGER(mpl) :: ioff2

    INTEGER(mpi) :: istat(6)

    INTEGER(mpi) :: j

    INTEGER(mpi) :: kn

    REAL(mpd) :: v1

    REAL(mpd) :: v2

    REAL(mpd) :: v3

    REAL(mpd) :: v4


    print *

    ioff1=0

    ioff2=0


    DO i=1, ncon

        kn=npar-ncon+i

        istat=0

        v1=0.;v2=0.;v3=0.;v4=0.

        ! expand row 'i' of matV into vecN

        ! non-zero range (excluding 'kn')

        ifirst=irangeparnz(1,i)

        ilast=irangeparnz(2,i)

        vecn=0._mpd

        vecn(ifirst:ilast)=matv(ioffrow(i)+1:ioffrow(i)+1+ilast-ifirst)

        DO j=1,npar+i-ncon

            IF (vecn(j) /= 0.0_mpd) THEN

                v2=vecn(j)

                IF (istat(3) == 0) THEN

                    istat(1)=j

                    v1=v2

                END IF

                istat(2)=j

                istat(3)=istat(3)+1

            END IF

        END DO

        ioff1=ioff1+npar

        DO j=1,ncon

            IF (matl(ioff2+j) /= 0.0_mpd) THEN

                v4=matl(ioff2+j)

                IF (istat(6) == 0) THEN

                    istat(4)=j

                    v3=v4

                END IF

                istat(5)=j

                istat(6)=istat(6)+1

            END IF

        END DO

        ioff2=ioff2+ncon

        print 100, i, istat, v1, v2, v3, v4, vecvk(i), irangeparnz(:,i)

    END DO

    print *

100 FORMAT(" qldump",7i8,5g13.5,2i8)


END SUBROUTINE qldump

mpdalc::mpalloc
allocate array
Definition: mpdalc.f90:36

mpdalc::mpdealloc
deallocate array
Definition: mpdalc.f90:42

monpgs
subroutine monpgs(i)
Progress monitoring.
Definition: mpmon.f90:68

qlmrq
subroutine qlmrq(x, m, t)
Multiply right by Q(t).
Definition: mpqldec.f90:466

qldump
subroutine qldump()
Print statistics.
Definition: mpqldec.f90:1031

qlsmq
subroutine qlsmq(x, t)
Similarity transformation by Q(t).
Definition: mpqldec.f90:514

qlpssq
subroutine qlpssq(aprod, B, m, t)
Partial similarity transformation by Q(t).
Definition: mpqldec.f90:712

qldecb
subroutine qldecb(a, bpar, bcon, rcon)
QL decomposition (for disjoint block matrix).
Definition: mpqldec.f90:220

qldec
subroutine qldec(a)
QL decomposition (as single block).
Definition: mpqldec.f90:126

qlmlq
subroutine qlmlq(x, m, t)
Multiply left by Q(t) (per block).
Definition: mpqldec.f90:405

qlsetb
subroutine qlsetb(ib)
Set block.
Definition: mpqldec.f90:1019

qlbsub
subroutine qlbsub(d, y)
Backward substitution (per block).
Definition: mpqldec.f90:992

qlini
subroutine qlini(n, m, l, s, k)
Initialize QL decomposition.
Definition: mpqldec.f90:62

qlgete
subroutine qlgete(emin, emax)
Get eigenvalues.
Definition: mpqldec.f90:956

qlssq
subroutine qlssq(aprod, A, s, roff, t)
Similarity transformation by Q(t).
Definition: mpqldec.f90:574

mpdalc
(De)Allocate vectors and arrays.
Definition: mpdalc.f90:24

mpdef
Definition of constants.
Definition: mpdef.f90:24

mpdef::mpd
integer, parameter mpd
double precision
Definition: mpdef.f90:38

mpqldec
QL data.
Definition: mpqldec.f90:31

mpqldec::ncon
integer(mpi) ncon
number of constraints
Definition: mpqldec.f90:36

mpqldec::iblock
integer(mpi) iblock
active block
Definition: mpqldec.f90:39

mpqldec::vecvk
real(mpd), dimension(:), allocatable vecvk
secondary diagonal of matV (including last element)
Definition: mpqldec.f90:42

mpqldec::irangeparnz
integer(mpi), dimension(:,:), allocatable irangeparnz
range for non zero part (except vecVk)
Definition: mpqldec.f90:49

mpqldec::monpg
integer(mpi) monpg
flag for progress monitoring
Definition: mpqldec.f90:40

mpqldec::ioffrow
integer(mpl), dimension(:), allocatable ioffrow
row offsets in matV (for constrint block)
Definition: mpqldec.f90:47

mpqldec::matsize
integer(mpl) matsize
size of contraints matrix
Definition: mpqldec.f90:38

mpqldec::matv
real(mpd), dimension(:), allocatable matv
unit normals (v_i) of Householder reflectors
Definition: mpqldec.f90:41

mpqldec::matl
real(mpd), dimension(:), allocatable matl
lower diagonal matrix L
Definition: mpqldec.f90:43

mpqldec::ioffpar
integer(mpi), dimension(:), allocatable ioffpar
parameter number offsets for matV ( " )
Definition: mpqldec.f90:48

mpqldec::nblock
integer(mpi) nblock
number of blocks
Definition: mpqldec.f90:37

mpqldec::vecn
real(mpd), dimension(:), allocatable vecn
normal vector
Definition: mpqldec.f90:44

mpqldec::npar
integer(mpi) npar
number of parameters
Definition: mpqldec.f90:35

mpqldec::ioffblock
integer(mpi), dimension(:), allocatable ioffblock
block offset (1.
Definition: mpqldec.f90:46

mpqldec::nparblock
integer(mpi), dimension(:), allocatable nparblock
number of parameters in block
Definition: mpqldec.f90:45