d1/d16/cuncsd2by1_8f_source.html

 *> \brief \b CUNCSD2BY1

 *

 *  =========== DOCUMENTATION ===========

 *

 * Online html documentation available at

 *            http://www.netlib.org/lapack/explore-html/

 *

 *> \htmlonly

 *> Download CUNCSD2BY1 + dependencies

 *> <a href="http://www.netlib.org/cgi-bin/netlibfiles.tgz?format=tgz&filename=/lapack/lapack_routine/cuncsd2by1.f">

 *> [TGZ]</a>

 *> <a href="http://www.netlib.org/cgi-bin/netlibfiles.zip?format=zip&filename=/lapack/lapack_routine/cuncsd2by1.f">

 *> [ZIP]</a>

 *> <a href="http://www.netlib.org/cgi-bin/netlibfiles.txt?format=txt&filename=/lapack/lapack_routine/cuncsd2by1.f">

 *> [TXT]</a>

 *> \endhtmlonly

 *

 *  Definition:

 *  ===========

 *

 *       SUBROUTINE CUNCSD2BY1( JOBU1, JOBU2, JOBV1T, M, P, Q, X11, LDX11,

 *                              X21, LDX21, THETA, U1, LDU1, U2, LDU2, V1T,

 *                              LDV1T, WORK, LWORK, RWORK, LRWORK, IWORK,

 *                              INFO )

 *

 *       .. Scalar Arguments ..

 *       CHARACTER          JOBU1, JOBU2, JOBV1T

 *       INTEGER            INFO, LDU1, LDU2, LDV1T, LWORK, LDX11, LDX21,

 *      $                   M, P, Q

 *       INTEGER            LRWORK, LRWORKMIN, LRWORKOPT

 *       ..

 *       .. Array Arguments ..

 *       REAL               RWORK(*)

 *       REAL               THETA(*)

 *       COMPLEX            U1(LDU1,*), U2(LDU2,*), V1T(LDV1T,*), WORK(*),

 *      $                   X11(LDX11,*), X21(LDX21,*)

 *       INTEGER            IWORK(*)

 *       ..

 *

 *

 *> \par Purpose:

 *> =============

 *>

 *>\verbatim

 *>

 *> CUNCSD2BY1 computes the CS decomposition of an M-by-Q matrix X with

 *> orthonormal columns that has been partitioned into a 2-by-1 block

 *> structure:

 *>

 *>                                [  I1 0  0 ]

 *>                                [  0  C  0 ]

 *>          [ X11 ]   [ U1 |    ] [  0  0  0 ]

 *>      X = [-----] = [---------] [----------] V1**T .

 *>          [ X21 ]   [    | U2 ] [  0  0  0 ]

 *>                                [  0  S  0 ]

 *>                                [  0  0  I2]

 *>

 *> X11 is P-by-Q. The unitary matrices U1, U2, and V1 are P-by-P,

 *> (M-P)-by-(M-P), and Q-by-Q, respectively. C and S are R-by-R

 *> nonnegative diagonal matrices satisfying C^2 + S^2 = I, in which

 *> R = MIN(P,M-P,Q,M-Q). I1 is a K1-by-K1 identity matrix and I2 is a

 *> K2-by-K2 identity matrix, where K1 = MAX(Q+P-M,0), K2 = MAX(Q-P,0).

 *>

 *> \endverbatim

 *

 *  Arguments:

 *  ==========

 *

 *> \param[in] JOBU1

 *> \verbatim

 *>          JOBU1 is CHARACTER

 *>          = 'Y':      U1 is computed;

 *>          otherwise:  U1 is not computed.

 *> \endverbatim

 *>

 *> \param[in] JOBU2

 *> \verbatim

 *>          JOBU2 is CHARACTER

 *>          = 'Y':      U2 is computed;

 *>          otherwise:  U2 is not computed.

 *> \endverbatim

 *>

 *> \param[in] JOBV1T

 *> \verbatim

 *>          JOBV1T is CHARACTER

 *>          = 'Y':      V1T is computed;

 *>          otherwise:  V1T is not computed.

 *> \endverbatim

 *>

 *> \param[in] M

 *> \verbatim

 *>          M is INTEGER

 *>          The number of rows in X.

 *> \endverbatim

 *>

 *> \param[in] P

 *> \verbatim

 *>          P is INTEGER

 *>          The number of rows in X11. 0 <= P <= M.

 *> \endverbatim

 *>

 *> \param[in] Q

 *> \verbatim

 *>          Q is INTEGER

 *>          The number of columns in X11 and X21. 0 <= Q <= M.

 *> \endverbatim

 *>

 *> \param[in,out] X11

 *> \verbatim

 *>          X11 is COMPLEX array, dimension (LDX11,Q)

 *>          On entry, part of the unitary matrix whose CSD is desired.

 *> \endverbatim

 *>

 *> \param[in] LDX11

 *> \verbatim

 *>          LDX11 is INTEGER

 *>          The leading dimension of X11. LDX11 >= MAX(1,P).

 *> \endverbatim

 *>

 *> \param[in,out] X21

 *> \verbatim

 *>          X21 is COMPLEX array, dimension (LDX21,Q)

 *>          On entry, part of the unitary matrix whose CSD is desired.

 *> \endverbatim

 *>

 *> \param[in] LDX21

 *> \verbatim

 *>          LDX21 is INTEGER

 *>          The leading dimension of X21. LDX21 >= MAX(1,M-P).

 *> \endverbatim

 *>

 *> \param[out] THETA

 *> \verbatim

 *>          THETA is REAL array, dimension (R), in which R =

 *>          MIN(P,M-P,Q,M-Q).

 *>          C = DIAG( COS(THETA(1)), ... , COS(THETA(R)) ) and

 *>          S = DIAG( SIN(THETA(1)), ... , SIN(THETA(R)) ).

 *> \endverbatim

 *>

 *> \param[out] U1

 *> \verbatim

 *>          U1 is COMPLEX array, dimension (P)

 *>          If JOBU1 = 'Y', U1 contains the P-by-P unitary matrix U1.

 *> \endverbatim

 *>

 *> \param[in] LDU1

 *> \verbatim

 *>          LDU1 is INTEGER

 *>          The leading dimension of U1. If JOBU1 = 'Y', LDU1 >=

 *>          MAX(1,P).

 *> \endverbatim

 *>

 *> \param[out] U2

 *> \verbatim

 *>          U2 is COMPLEX array, dimension (M-P)

 *>          If JOBU2 = 'Y', U2 contains the (M-P)-by-(M-P) unitary

 *>          matrix U2.

 *> \endverbatim

 *>

 *> \param[in] LDU2

 *> \verbatim

 *>          LDU2 is INTEGER

 *>          The leading dimension of U2. If JOBU2 = 'Y', LDU2 >=

 *>          MAX(1,M-P).

 *> \endverbatim

 *>

 *> \param[out] V1T

 *> \verbatim

 *>          V1T is COMPLEX array, dimension (Q)

 *>          If JOBV1T = 'Y', V1T contains the Q-by-Q matrix unitary

 *>          matrix V1**T.

 *> \endverbatim

 *>

 *> \param[in] LDV1T

 *> \verbatim

 *>          LDV1T is INTEGER

 *>          The leading dimension of V1T. If JOBV1T = 'Y', LDV1T >=

 *>          MAX(1,Q).

 *> \endverbatim

 *>

 *> \param[out] WORK

 *> \verbatim

 *>          WORK is COMPLEX array, dimension (MAX(1,LWORK))

 *>          On exit, if INFO = 0, WORK(1) returns the optimal LWORK.

 *> \endverbatim

 *>

 *> \param[in] LWORK

 *> \verbatim

 *>          LWORK is INTEGER

 *>          The dimension of the array WORK.

 *>

 *>          If LWORK = -1, then a workspace query is assumed; the routine

 *>          only calculates the optimal size of the WORK array, returns

 *>          this value as the first entry of the work array, and no error

 *>          message related to LWORK is issued by XERBLA.

 *> \endverbatim

 *>

 *> \param[out] RWORK

 *> \verbatim

 *>          RWORK is REAL array, dimension (MAX(1,LRWORK))

 *>          On exit, if INFO = 0, RWORK(1) returns the optimal LRWORK.

 *>          If INFO > 0 on exit, RWORK(2:R) contains the values PHI(1),

 *>          ..., PHI(R-1) that, together with THETA(1), ..., THETA(R),

 *>          define the matrix in intermediate bidiagonal-block form

 *>          remaining after nonconvergence. INFO specifies the number

 *>          of nonzero PHI's.

 *> \endverbatim

 *>

 *> \param[in] LRWORK

 *> \verbatim

 *>          LRWORK is INTEGER

 *>          The dimension of the array RWORK.

 *>

 *>          If LRWORK = -1, then a workspace query is assumed; the routine

 *>          only calculates the optimal size of the RWORK array, returns

 *>          this value as the first entry of the work array, and no error

 *>          message related to LRWORK is issued by XERBLA.

 *> \endverbatim

 *

 *> \param[out] IWORK

 *> \verbatim

 *>          IWORK is INTEGER array, dimension (M-MIN(P,M-P,Q,M-Q))

 *> \endverbatim

 *>

 *> \param[out] INFO

 *> \verbatim

 *>          INFO is INTEGER

 *>          = 0:  successful exit.

 *>          < 0:  if INFO = -i, the i-th argument had an illegal value.

 *>          > 0:  CBBCSD did not converge. See the description of WORK

 *>                above for details.

 *> \endverbatim

 *

 *> \par References:

 *  ================

 *>

 *>  [1] Brian D. Sutton. Computing the complete CS decomposition. Numer.

 *>      Algorithms, 50(1):33-65, 2009.

 *

 *  Authors:

 *  ========

 *

 *> \author Univ. of Tennessee

 *> \author Univ. of California Berkeley

 *> \author Univ. of Colorado Denver

 *> \author NAG Ltd.

 *

 *> \date June 2016

 *

 *> \ingroup complexOTHERcomputational

 *

 *  =====================================================================

       SUBROUTINE cuncsd2by1( JOBU1, JOBU2, JOBV1T, M, P, Q, X11, LDX11,

      $                       x21, ldx21, theta, u1, ldu1, u2, ldu2, v1t,

      $                       ldv1t, work, lwork, rwork, lrwork, iwork,

      $                       info )

 *

 *  -- LAPACK computational routine (version 3.7.0) --

 *  -- LAPACK is a software package provided by Univ. of Tennessee,    --

 *  -- Univ. of California Berkeley, Univ. of Colorado Denver and NAG Ltd..--

 *     June 2016

 *

 *     .. Scalar Arguments ..

       CHARACTER          JOBU1, JOBU2, JOBV1T

       INTEGER            INFO, LDU1, LDU2, LDV1T, LWORK, LDX11, LDX21,

      $                   m, p, q

       INTEGER            LRWORK, LRWORKMIN, LRWORKOPT

 *     ..

 *     .. Array Arguments ..

       REAL               RWORK(*)

       REAL               THETA(*)

       COMPLEX            U1(ldu1,*), U2(ldu2,*), V1T(ldv1t,*), WORK(*),

      $                   x11(ldx11,*), x21(ldx21,*)

       INTEGER            IWORK(*)

 *     ..

 *

 *  =====================================================================

 *

 *     .. Parameters ..

       COMPLEX            ONE, ZERO

       parameter                ( one = (1.0e0,0.0e0), zero = (0.0e0,0.0e0) )

 *     ..

 *     .. Local Scalars ..

       INTEGER            CHILDINFO, I, IB11D, IB11E, IB12D, IB12E,

      $                   ib21d, ib21e, ib22d, ib22e, ibbcsd, iorbdb,

      $                   iorglq, iorgqr, iphi, itaup1, itaup2, itauq1,

      $                   j, lbbcsd, lorbdb, lorglq, lorglqmin,

      $                   lorglqopt, lorgqr, lorgqrmin, lorgqropt,

      $                   lworkmin, lworkopt, r

       LOGICAL            LQUERY, WANTU1, WANTU2, WANTV1T

 *     ..

 *     .. Local Arrays ..

       REAL               DUM( 1 )

       COMPLEX            CDUM( 1, 1 )

 *     ..

 *     .. External Subroutines ..

       EXTERNAL           cbbcsd, ccopy, clacpy, clapmr, clapmt, cunbdb1,

      $                   cunbdb2, cunbdb3, cunbdb4, cunglq, cungqr,

      $                   xerbla

 *     ..

 *     .. External Functions ..

       LOGICAL            LSAME

       EXTERNAL           lsame

 *     ..

 *     .. Intrinsic Function ..

       INTRINSIC          int, max, min

 *     ..

 *     .. Executable Statements ..

 *

 *     Test input arguments

 *

       info = 0

       wantu1 = lsame( jobu1, 'Y' )

       wantu2 = lsame( jobu2, 'Y' )

       wantv1t = lsame( jobv1t, 'Y' )

       lquery = lwork .EQ. -1

 *

       IF( m .LT. 0 ) THEN

          info = -4

       ELSE IF( p .LT. 0 .OR. p .GT. m ) THEN

          info = -5

       ELSE IF( q .LT. 0 .OR. q .GT. m ) THEN

          info = -6

       ELSE IF( ldx11 .LT. max( 1, p ) ) THEN

          info = -8

       ELSE IF( ldx21 .LT. max( 1, m-p ) ) THEN

          info = -10

       ELSE IF( wantu1 .AND. ldu1 .LT. max( 1, p ) ) THEN

          info = -13

       ELSE IF( wantu2 .AND. ldu2 .LT. max( 1, m - p ) ) THEN

          info = -15

       ELSE IF( wantv1t .AND. ldv1t .LT. max( 1, q ) ) THEN

          info = -17

       END IF

 *

       r = min( p, m-p, q, m-q )

 *

 *     Compute workspace

 *

 *       WORK layout:

 *     |-----------------------------------------|

 *     | LWORKOPT (1)                            |

 *     |-----------------------------------------|

 *     | TAUP1 (MAX(1,P))                        |

 *     | TAUP2 (MAX(1,M-P))                      |

 *     | TAUQ1 (MAX(1,Q))                        |

 *     |-----------------------------------------|

 *     | CUNBDB WORK | CUNGQR WORK | CUNGLQ WORK |

 *     |             |             |             |

 *     |             |             |             |

 *     |             |             |             |

 *     |             |             |             |

 *     |-----------------------------------------|

 *       RWORK layout:

 *     |------------------|

 *     | LRWORKOPT (1)    |

 *     |------------------|

 *     | PHI (MAX(1,R-1)) |

 *     |------------------|

 *     | B11D (R)         |

 *     | B11E (R-1)       |

 *     | B12D (R)         |

 *     | B12E (R-1)       |

 *     | B21D (R)         |

 *     | B21E (R-1)       |

 *     | B22D (R)         |

 *     | B22E (R-1)       |

 *     | CBBCSD RWORK     |

 *     |------------------|

 *

       IF( info .EQ. 0 ) THEN

          iphi = 2

          ib11d = iphi + max( 1, r-1 )

          ib11e = ib11d + max( 1, r )

          ib12d = ib11e + max( 1, r - 1 )

          ib12e = ib12d + max( 1, r )

          ib21d = ib12e + max( 1, r - 1 )

          ib21e = ib21d + max( 1, r )

          ib22d = ib21e + max( 1, r - 1 )

          ib22e = ib22d + max( 1, r )

          ibbcsd = ib22e + max( 1, r - 1 )

          itaup1 = 2

          itaup2 = itaup1 + max( 1, p )

          itauq1 = itaup2 + max( 1, m-p )

          iorbdb = itauq1 + max( 1, q )

          iorgqr = itauq1 + max( 1, q )

          iorglq = itauq1 + max( 1, q )

          lorgqrmin = 1

          lorgqropt = 1

          lorglqmin = 1

          lorglqopt = 1

          IF( r .EQ. q ) THEN

             CALL cunbdb1( m, p, q, x11, ldx11, x21, ldx21, theta,

      $                    dum, cdum, cdum, cdum, work, -1,

      $                    childinfo )

             lorbdb = int( work(1) )

             IF( wantu1 .AND. p .GT. 0 ) THEN

                CALL cungqr( p, p, q, u1, ldu1, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             ENDIF

             IF( wantu2 .AND. m-p .GT. 0 ) THEN

                CALL cungqr( m-p, m-p, q, u2, ldu2, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, m-p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantv1t .AND. q .GT. 0 ) THEN

                CALL cunglq( q-1, q-1, q-1, v1t, ldv1t,

      $                      cdum, work(1), -1, childinfo )

                lorglqmin = max( lorglqmin, q-1 )

                lorglqopt = max( lorglqopt, int( work(1) ) )

             END IF

             CALL cbbcsd( jobu1, jobu2, jobv1t, 'N', 'N', m, p, q, theta,

      $                   dum(1), u1, ldu1, u2, ldu2, v1t, ldv1t, cdum,

      $                   1, dum, dum, dum, dum, dum, dum, dum, dum,

      $                   rwork(1), -1, childinfo )

             lbbcsd = int( rwork(1) )

          ELSE IF( r .EQ. p ) THEN

             CALL cunbdb2( m, p, q, x11, ldx11, x21, ldx21, theta, dum,

      $                    cdum, cdum, cdum, work(1), -1, childinfo )

             lorbdb = int( work(1) )

             IF( wantu1 .AND. p .GT. 0 ) THEN

                CALL cungqr( p-1, p-1, p-1, u1(2,2), ldu1, cdum, work(1),

      $                      -1, childinfo )

                lorgqrmin = max( lorgqrmin, p-1 )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantu2 .AND. m-p .GT. 0 ) THEN

                CALL cungqr( m-p, m-p, q, u2, ldu2, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, m-p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantv1t .AND. q .GT. 0 ) THEN

                CALL cunglq( q, q, r, v1t, ldv1t, cdum, work(1), -1,

      $                      childinfo )

                lorglqmin = max( lorglqmin, q )

                lorglqopt = max( lorglqopt, int( work(1) ) )

             END IF

             CALL cbbcsd( jobv1t, 'N', jobu1, jobu2, 'T', m, q, p, theta,

      $                   dum, v1t, ldv1t, cdum, 1, u1, ldu1, u2, ldu2,

      $                   dum, dum, dum, dum, dum, dum, dum, dum,

      $                   rwork(1), -1, childinfo )

             lbbcsd = int( rwork(1) )

          ELSE IF( r .EQ. m-p ) THEN

             CALL cunbdb3( m, p, q, x11, ldx11, x21, ldx21, theta, dum,

      $                    cdum, cdum, cdum, work(1), -1, childinfo )

             lorbdb = int( work(1) )

             IF( wantu1 .AND. p .GT. 0 ) THEN

                CALL cungqr( p, p, q, u1, ldu1, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantu2 .AND. m-p .GT. 0 ) THEN

                CALL cungqr( m-p-1, m-p-1, m-p-1, u2(2,2), ldu2, cdum,

      $                      work(1), -1, childinfo )

                lorgqrmin = max( lorgqrmin, m-p-1 )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantv1t .AND. q .GT. 0 ) THEN

                CALL cunglq( q, q, r, v1t, ldv1t, cdum, work(1), -1,

      $                      childinfo )

                lorglqmin = max( lorglqmin, q )

                lorglqopt = max( lorglqopt, int( work(1) ) )

             END IF

             CALL cbbcsd( 'N', jobv1t, jobu2, jobu1, 'T', m, m-q, m-p,

      $                   theta, dum, cdum, 1, v1t, ldv1t, u2, ldu2, u1,

      $                   ldu1, dum, dum, dum, dum, dum, dum, dum, dum,

      $                   rwork(1), -1, childinfo )

             lbbcsd = int( rwork(1) )

          ELSE

             CALL cunbdb4( m, p, q, x11, ldx11, x21, ldx21, theta, dum,

      $                    cdum, cdum, cdum, cdum, work(1), -1, childinfo

      $                  )

             lorbdb = m + int( work(1) )

             IF( wantu1 .AND. p .GT. 0 ) THEN

                CALL cungqr( p, p, m-q, u1, ldu1, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantu2 .AND. m-p .GT. 0 ) THEN

                CALL cungqr( m-p, m-p, m-q, u2, ldu2, cdum, work(1), -1,

      $                      childinfo )

                lorgqrmin = max( lorgqrmin, m-p )

                lorgqropt = max( lorgqropt, int( work(1) ) )

             END IF

             IF( wantv1t .AND. q .GT. 0 ) THEN

                CALL cunglq( q, q, q, v1t, ldv1t, cdum, work(1), -1,

      $                      childinfo )

                lorglqmin = max( lorglqmin, q )

                lorglqopt = max( lorglqopt, int( work(1) ) )

             END IF

             CALL cbbcsd( jobu2, jobu1, 'N', jobv1t, 'N', m, m-p, m-q,

      $                   theta, dum, u2, ldu2, u1, ldu1, cdum, 1, v1t,

      $                   ldv1t, dum, dum, dum, dum, dum, dum, dum, dum,

      $                   rwork(1), -1, childinfo )

             lbbcsd = int( rwork(1) )

          END IF

          lrworkmin = ibbcsd+lbbcsd-1

          lrworkopt = lrworkmin

          rwork(1) = lrworkopt

          lworkmin = max( iorbdb+lorbdb-1,

      $                   iorgqr+lorgqrmin-1,

      $                   iorglq+lorglqmin-1 )

          lworkopt = max( iorbdb+lorbdb-1,

      $                   iorgqr+lorgqropt-1,

      $                   iorglq+lorglqopt-1 )

          work(1) = lworkopt

          IF( lwork .LT. lworkmin .AND. .NOT.lquery ) THEN

             info = -19

          END IF

       END IF

       IF( info .NE. 0 ) THEN

          CALL xerbla( 'CUNCSD2BY1', -info )

          RETURN

       ELSE IF( lquery ) THEN

          RETURN

       END IF

       lorgqr = lwork-iorgqr+1

       lorglq = lwork-iorglq+1

 *

 *     Handle four cases separately: R = Q, R = P, R = M-P, and R = M-Q,

 *     in which R = MIN(P,M-P,Q,M-Q)

 *

       IF( r .EQ. q ) THEN

 *

 *        Case 1: R = Q

 *

 *        Simultaneously bidiagonalize X11 and X21

 *

          CALL cunbdb1( m, p, q, x11, ldx11, x21, ldx21, theta,

      $                 rwork(iphi), work(itaup1), work(itaup2),

      $                 work(itauq1), work(iorbdb), lorbdb, childinfo )

 *

 *        Accumulate Householder reflectors

 *

          IF( wantu1 .AND. p .GT. 0 ) THEN

             CALL clacpy( 'L', p, q, x11, ldx11, u1, ldu1 )

             CALL cungqr( p, p, q, u1, ldu1, work(itaup1), work(iorgqr),

      $                   lorgqr, childinfo )

          END IF

          IF( wantu2 .AND. m-p .GT. 0 ) THEN

             CALL clacpy( 'L', m-p, q, x21, ldx21, u2, ldu2 )

             CALL cungqr( m-p, m-p, q, u2, ldu2, work(itaup2),

      $                   work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantv1t .AND. q .GT. 0 ) THEN

             v1t(1,1) = one

             DO j = 2, q

                v1t(1,j) = zero

                v1t(j,1) = zero

             END DO

             CALL clacpy( 'U', q-1, q-1, x21(1,2), ldx21, v1t(2,2),

      $                   ldv1t )

             CALL cunglq( q-1, q-1, q-1, v1t(2,2), ldv1t, work(itauq1),

      $                   work(iorglq), lorglq, childinfo )

          END IF

 *

 *        Simultaneously diagonalize X11 and X21.

 *

          CALL cbbcsd( jobu1, jobu2, jobv1t, 'N', 'N', m, p, q, theta,

      $                rwork(iphi), u1, ldu1, u2, ldu2, v1t, ldv1t, cdum,

      $                1, rwork(ib11d), rwork(ib11e), rwork(ib12d),

      $                rwork(ib12e), rwork(ib21d), rwork(ib21e),

      $                rwork(ib22d), rwork(ib22e), rwork(ibbcsd), lbbcsd,

      $                childinfo )

 *

 *        Permute rows and columns to place zero submatrices in

 *        preferred positions

 *

          IF( q .GT. 0 .AND. wantu2 ) THEN

             DO i = 1, q

                iwork(i) = m - p - q + i

             END DO

             DO i = q + 1, m - p

                iwork(i) = i - q

             END DO

             CALL clapmt( .false., m-p, m-p, u2, ldu2, iwork )

          END IF

       ELSE IF( r .EQ. p ) THEN

 *

 *        Case 2: R = P

 *

 *        Simultaneously bidiagonalize X11 and X21

 *

          CALL cunbdb2( m, p, q, x11, ldx11, x21, ldx21, theta,

      $                 rwork(iphi), work(itaup1), work(itaup2),

      $                 work(itauq1), work(iorbdb), lorbdb, childinfo )

 *

 *        Accumulate Householder reflectors

 *

          IF( wantu1 .AND. p .GT. 0 ) THEN

             u1(1,1) = one

             DO j = 2, p

                u1(1,j) = zero

                u1(j,1) = zero

             END DO

             CALL clacpy( 'L', p-1, p-1, x11(2,1), ldx11, u1(2,2), ldu1 )

             CALL cungqr( p-1, p-1, p-1, u1(2,2), ldu1, work(itaup1),

      $                   work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantu2 .AND. m-p .GT. 0 ) THEN

             CALL clacpy( 'L', m-p, q, x21, ldx21, u2, ldu2 )

             CALL cungqr( m-p, m-p, q, u2, ldu2, work(itaup2),

      $                   work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantv1t .AND. q .GT. 0 ) THEN

             CALL clacpy( 'U', p, q, x11, ldx11, v1t, ldv1t )

             CALL cunglq( q, q, r, v1t, ldv1t, work(itauq1),

      $                   work(iorglq), lorglq, childinfo )

          END IF

 *

 *        Simultaneously diagonalize X11 and X21.

 *

          CALL cbbcsd( jobv1t, 'N', jobu1, jobu2, 'T', m, q, p, theta,

      $                rwork(iphi), v1t, ldv1t, cdum, 1, u1, ldu1, u2,

      $                ldu2, rwork(ib11d), rwork(ib11e), rwork(ib12d),

      $                rwork(ib12e), rwork(ib21d), rwork(ib21e),

      $                rwork(ib22d), rwork(ib22e), rwork(ibbcsd), lbbcsd,

      $                childinfo )

 *

 *        Permute rows and columns to place identity submatrices in

 *        preferred positions

 *

          IF( q .GT. 0 .AND. wantu2 ) THEN

             DO i = 1, q

                iwork(i) = m - p - q + i

             END DO

             DO i = q + 1, m - p

                iwork(i) = i - q

             END DO

             CALL clapmt( .false., m-p, m-p, u2, ldu2, iwork )

          END IF

       ELSE IF( r .EQ. m-p ) THEN

 *

 *        Case 3: R = M-P

 *

 *        Simultaneously bidiagonalize X11 and X21

 *

          CALL cunbdb3( m, p, q, x11, ldx11, x21, ldx21, theta,

      $                 rwork(iphi), work(itaup1), work(itaup2),

      $                 work(itauq1), work(iorbdb), lorbdb, childinfo )

 *

 *        Accumulate Householder reflectors

 *

          IF( wantu1 .AND. p .GT. 0 ) THEN

             CALL clacpy( 'L', p, q, x11, ldx11, u1, ldu1 )

             CALL cungqr( p, p, q, u1, ldu1, work(itaup1), work(iorgqr),

      $                   lorgqr, childinfo )

          END IF

          IF( wantu2 .AND. m-p .GT. 0 ) THEN

             u2(1,1) = one

             DO j = 2, m-p

                u2(1,j) = zero

                u2(j,1) = zero

             END DO

             CALL clacpy( 'L', m-p-1, m-p-1, x21(2,1), ldx21, u2(2,2),

      $                   ldu2 )

             CALL cungqr( m-p-1, m-p-1, m-p-1, u2(2,2), ldu2,

      $                   work(itaup2), work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantv1t .AND. q .GT. 0 ) THEN

             CALL clacpy( 'U', m-p, q, x21, ldx21, v1t, ldv1t )

             CALL cunglq( q, q, r, v1t, ldv1t, work(itauq1),

      $                   work(iorglq), lorglq, childinfo )

          END IF

 *

 *        Simultaneously diagonalize X11 and X21.

 *

          CALL cbbcsd( 'N', jobv1t, jobu2, jobu1, 'T', m, m-q, m-p,

      $                theta, rwork(iphi), cdum, 1, v1t, ldv1t, u2, ldu2,

      $                u1, ldu1, rwork(ib11d), rwork(ib11e),

      $                rwork(ib12d), rwork(ib12e), rwork(ib21d),

      $                rwork(ib21e), rwork(ib22d), rwork(ib22e),

      $                rwork(ibbcsd), lbbcsd, childinfo )

 *

 *        Permute rows and columns to place identity submatrices in

 *        preferred positions

 *

          IF( q .GT. r ) THEN

             DO i = 1, r

                iwork(i) = q - r + i

             END DO

             DO i = r + 1, q

                iwork(i) = i - r

             END DO

             IF( wantu1 ) THEN

                CALL clapmt( .false., p, q, u1, ldu1, iwork )

             END IF

             IF( wantv1t ) THEN

                CALL clapmr( .false., q, q, v1t, ldv1t, iwork )

             END IF

          END IF

       ELSE

 *

 *        Case 4: R = M-Q

 *

 *        Simultaneously bidiagonalize X11 and X21

 *

          CALL cunbdb4( m, p, q, x11, ldx11, x21, ldx21, theta,

      $                 rwork(iphi), work(itaup1), work(itaup2),

      $                 work(itauq1), work(iorbdb), work(iorbdb+m),

      $                 lorbdb-m, childinfo )

 *

 *        Accumulate Householder reflectors

 *

          IF( wantu1 .AND. p .GT. 0 ) THEN

             CALL ccopy( p, work(iorbdb), 1, u1, 1 )

             DO j = 2, p

                u1(1,j) = zero

             END DO

             CALL clacpy( 'L', p-1, m-q-1, x11(2,1), ldx11, u1(2,2),

      $                   ldu1 )

             CALL cungqr( p, p, m-q, u1, ldu1, work(itaup1),

      $                   work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantu2 .AND. m-p .GT. 0 ) THEN

             CALL ccopy( m-p, work(iorbdb+p), 1, u2, 1 )

             DO j = 2, m-p

                u2(1,j) = zero

             END DO

             CALL clacpy( 'L', m-p-1, m-q-1, x21(2,1), ldx21, u2(2,2),

      $                   ldu2 )

             CALL cungqr( m-p, m-p, m-q, u2, ldu2, work(itaup2),

      $                   work(iorgqr), lorgqr, childinfo )

          END IF

          IF( wantv1t .AND. q .GT. 0 ) THEN

             CALL clacpy( 'U', m-q, q, x21, ldx21, v1t, ldv1t )

             CALL clacpy( 'U', p-(m-q), q-(m-q), x11(m-q+1,m-q+1), ldx11,

      $                   v1t(m-q+1,m-q+1), ldv1t )

             CALL clacpy( 'U', -p+q, q-p, x21(m-q+1,p+1), ldx21,

      $                   v1t(p+1,p+1), ldv1t )

             CALL cunglq( q, q, q, v1t, ldv1t, work(itauq1),

      $                   work(iorglq), lorglq, childinfo )

          END IF

 *

 *        Simultaneously diagonalize X11 and X21.

 *

          CALL cbbcsd( jobu2, jobu1, 'N', jobv1t, 'N', m, m-p, m-q,

      $                theta, rwork(iphi), u2, ldu2, u1, ldu1, cdum, 1,

      $                v1t, ldv1t, rwork(ib11d), rwork(ib11e),

      $                rwork(ib12d), rwork(ib12e), rwork(ib21d),

      $                rwork(ib21e), rwork(ib22d), rwork(ib22e),

      $                rwork(ibbcsd), lbbcsd, childinfo )

 *

 *        Permute rows and columns to place identity submatrices in

 *        preferred positions

 *

          IF( p .GT. r ) THEN

             DO i = 1, r

                iwork(i) = p - r + i

             END DO

             DO i = r + 1, p

                iwork(i) = i - r

             END DO

             IF( wantu1 ) THEN

                CALL clapmt( .false., p, p, u1, ldu1, iwork )

             END IF

             IF( wantv1t ) THEN

                CALL clapmr( .false., p, q, v1t, ldv1t, iwork )

             END IF

          END IF

       END IF

 *

       RETURN

 *

 *     End of CUNCSD2BY1

 *

       END


clapmt
subroutine clapmt(FORWRD, M, N, X, LDX, K)
CLAPMT performs a forward or backward permutation of the columns of a matrix.
Definition: clapmt.f:106

cbbcsd
subroutine cbbcsd(JOBU1, JOBU2, JOBV1T, JOBV2T, TRANS, M, P, Q,                                                                                           THETA, PHI, U1, LDU1, U2, LDU2, V1T, LDV1T,                                                                                           V2T, LDV2T, B11D, B11E, B12D, B12E, B21D, B21E,                                                                                           B22D, B22E, RWORK, LRWORK, INFO)
CBBCSD
Definition: cbbcsd.f:334

cungqr
subroutine cungqr(M, N, K, A, LDA, TAU, WORK, LWORK, INFO)
CUNGQR
Definition: cungqr.f:130

clapmr
subroutine clapmr(FORWRD, M, N, X, LDX, K)
CLAPMR rearranges rows of a matrix as specified by a permutation vector.
Definition: clapmr.f:106

cunbdb1
subroutine cunbdb1(M, P, Q, X11, LDX11, X21, LDX21, THETA, PHI,                                                                                               TAUP1, TAUP2, TAUQ1, WORK, LWORK, INFO)
CUNBDB1
Definition: cunbdb1.f:204

cunbdb4
subroutine cunbdb4(M, P, Q, X11, LDX11, X21, LDX21, THETA, PHI,                                                                                               TAUP1, TAUP2, TAUQ1, PHANTOM, WORK, LWORK,                                                                                               INFO)
CUNBDB4
Definition: cunbdb4.f:215

xerbla
subroutine xerbla(SRNAME, INFO)
XERBLA
Definition: xerbla.f:62

clacpy
subroutine clacpy(UPLO, M, N, A, LDA, B, LDB)
CLACPY copies all or part of one two-dimensional array to another.
Definition: clacpy.f:105

cunbdb3
subroutine cunbdb3(M, P, Q, X11, LDX11, X21, LDX21, THETA, PHI,                                                                                               TAUP1, TAUP2, TAUQ1, WORK, LWORK, INFO)
CUNBDB3
Definition: cunbdb3.f:204

ccopy
subroutine ccopy(N, CX, INCX, CY, INCY)
CCOPY
Definition: ccopy.f:52

cunbdb2
subroutine cunbdb2(M, P, Q, X11, LDX11, X21, LDX21, THETA, PHI,                                                                                               TAUP1, TAUP2, TAUQ1, WORK, LWORK, INFO)
CUNBDB2
Definition: cunbdb2.f:204

cuncsd2by1
subroutine cuncsd2by1(JOBU1, JOBU2, JOBV1T, M, P, Q, X11, LDX11,                                                                                                           X21, LDX21, THETA, U1, LDU1, U2, LDU2, V1T,                                                                                                           LDV1T, WORK, LWORK, RWORK, LRWORK, IWORK,                                                                                                           INFO)
CUNCSD2BY1
Definition: cuncsd2by1.f:257

cunglq
subroutine cunglq(M, N, K, A, LDA, TAU, WORK, LWORK, INFO)
CUNGLQ
Definition: cunglq.f:129