libscran/ResidualPca_8hpp_source.html

#ifndef SCRAN_RESIDUAL_PCA_HPP

#define SCRAN_RESIDUAL_PCA_HPP


#include "../utils/macros.hpp"


#include "tatami/tatami.hpp"


#include "irlba/irlba.hpp"

#include "Eigen/Dense"


#include <vector>

#include <cmath>


#include "utils.hpp"

#include "convert.hpp"

#include "wrappers.hpp"

#include "blocking.hpp"


namespace scran {


class ResidualPca {

public:


    struct Defaults {

        static constexpr int rank = 10;


        static constexpr bool scale = false;


        static constexpr bool transpose = true;


        static constexpr int num_threads = 1;


        static constexpr WeightPolicy block_weight_policy = WeightPolicy::VARIABLE;


        static constexpr VariableBlockWeightParameters variable_block_weight_parameters = VariableBlockWeightParameters();


        static constexpr bool return_rotation = false;


        static constexpr bool return_center = false;


        static constexpr bool return_scale = false;

    };


private:

    bool scale = Defaults::scale;

    bool transpose = Defaults::transpose;

    int rank = Defaults::rank;


    bool return_rotation = Defaults::return_rotation;

    bool return_center = Defaults::return_center;

    bool return_scale = Defaults::return_scale;


    WeightPolicy block_weight_policy = Defaults::block_weight_policy;

    VariableBlockWeightParameters variable_block_weight_parameters = Defaults::variable_block_weight_parameters;


    int nthreads = Defaults::num_threads;


public:


    ResidualPca& set_rank(int r = Defaults::rank) {

        rank = r;

        return *this;

    }


    ResidualPca& set_scale(bool s = Defaults::scale) {

        scale = s;

        return *this;

    }


    ResidualPca& set_transpose(bool t = Defaults::transpose) {

        transpose = t;

        return *this;

    }


    ResidualPca& set_return_rotation(bool r = Defaults::return_rotation) {

        return_rotation = r;

        return *this;

    }


    ResidualPca& set_return_center(bool r = Defaults::return_center) {

        return_center = r;

        return *this;

    }


    ResidualPca& set_return_scale(bool r = Defaults::return_scale) {

        return_scale = r;

        return *this;

    }


    ResidualPca& set_block_weight_policy(WeightPolicy w = Defaults::block_weight_policy) {

        block_weight_policy = w;

        return *this;

    }


    ResidualPca& set_variable_block_weight_parameters(VariableBlockWeightParameters v = Defaults::variable_block_weight_parameters) {

        variable_block_weight_parameters = v;

        return *this;

    }


    ResidualPca& set_num_threads(int n = Defaults::num_threads) {

        nthreads = n;

        return *this;

    }


private:

    template<bool weight_, typename Data_, typename Index_, typename Block_>

    void run_sparse(

        const tatami::Matrix<Data_, Index_>* mat,

        const Block_* block,

        const pca_utils::BlockingDetails<weight_>& block_details,

        const irlba::Irlba& irb,

        Eigen::MatrixXd& pcs,

        Eigen::MatrixXd& rotation,

        Eigen::VectorXd& variance_explained,

        Eigen::MatrixXd& center_m,

        Eigen::VectorXd& scale_v,

        double& total_var)

    const {

        auto ngenes = mat->nrow(), ncells = mat->ncol();

        auto extracted = pca_utils::extract_sparse_for_pca(mat, nthreads); // row-major filling.

        pca_utils::SparseMatrix emat(ncells, ngenes, std::move(extracted.values), std::move(extracted.indices), std::move(extracted.ptrs), nthreads); // CSC with genes in columns.


        auto nblocks = block_details.num_blocks();

        center_m.resize(nblocks, ngenes);

        scale_v.resize(ngenes);

        pca_utils::compute_mean_and_variance_regress<weight_>(emat, block, block_details, center_m, scale_v, nthreads);

        total_var = pca_utils::process_scale_vector(scale, scale_v);


        pca_utils::RegressWrapper<decltype(emat), Block_> centered(&emat, block, &center_m);

        if constexpr(weight_) {

            if (scale) {

                irlba::Scaled<decltype(centered)> scaled(&centered, &scale_v);

                pca_utils::SampleScaledWrapper<decltype(scaled)> weighted(&scaled, &(block_details.expanded_weights));

                irb.run(weighted, pcs, rotation, variance_explained);

            } else {

                pca_utils::SampleScaledWrapper<decltype(centered)> weighted(&centered, &(block_details.expanded_weights));

                irb.run(weighted, pcs, rotation, variance_explained);

            }


            // This transposes 'pcs' to be a NDIM * NCELLS matrix.

            pca_utils::project_sparse_matrix(emat, pcs, rotation, scale, scale_v, nthreads);


            // Subtracting each block's mean from the PCs.

            Eigen::MatrixXd centering;

            if (scale) {

                centering = (center_m * (rotation.array().colwise() / scale_v.array()).matrix()).adjoint();

            } else {

                centering = (center_m * rotation).adjoint();

            }

            for (size_t i = 0, iend = pcs.cols(); i < iend; ++i) {

                pcs.col(i) -= centering.col(block[i]);

            }


            pca_utils::clean_up_projected<true>(pcs, variance_explained);

            if (!transpose) {

                pcs.adjointInPlace();

            }


        } else {

            if (scale) {

                irlba::Scaled<decltype(centered)> scaled(&centered, &scale_v);

                irb.run(scaled, pcs, rotation, variance_explained);

            } else {

                irb.run(centered, pcs, rotation, variance_explained);

            }


            pca_utils::clean_up(mat->ncol(), pcs, variance_explained);

            if (transpose) {

                pcs.adjointInPlace();

            }

        }

    }


    template<bool weight_, typename Data_, typename Index_, typename Block_>

    void run_dense(

        const tatami::Matrix<Data_, Index_>* mat,

        const Block_* block,

        const pca_utils::BlockingDetails<weight_>& block_details,

        const irlba::Irlba& irb,

        Eigen::MatrixXd& pcs,

        Eigen::MatrixXd& rotation,

        Eigen::VectorXd& variance_explained,

        Eigen::MatrixXd& center_m,

        Eigen::VectorXd& scale_v,

        double& total_var)

    const {

        auto emat = pca_utils::extract_dense_for_pca(mat, nthreads); // get a column-major matrix with genes in columns.


        auto ngenes = emat.cols();

        auto nblocks = block_details.num_blocks();

        center_m.resize(nblocks, ngenes);

        scale_v.resize(ngenes);

        pca_utils::compute_mean_and_variance_regress<weight_>(emat, block, block_details, center_m, scale_v, nthreads);

        total_var = pca_utils::process_scale_vector(scale, scale_v);


        // Applying the centering and scaling directly so that we can run the PCA with no or fewer layers.

        tatami::parallelize([&](size_t, size_t start, size_t length) -> void {

            size_t ncells = emat.rows();

            double* ptr = emat.data() + static_cast<size_t>(start) * ncells;

            for (size_t g = start, end = start + length; g < end; ++g, ptr += ncells) {

                for (size_t c = 0; c < ncells; ++c) {

                    ptr[c] -= center_m.coeff(block[c], g);

                }


                if (scale) {

                    auto sd = scale_v[g];

                    for (size_t c = 0; c < ncells; ++c) {

                        ptr[c] /= sd; // process_scale_vector should already protect against division by zero.

                    }

                }

            }

        }, ngenes, nthreads);


        if constexpr(weight_) {

            pca_utils::SampleScaledWrapper<decltype(emat)> weighted(&emat, &(block_details.expanded_weights));

            irb.run(weighted, pcs, rotation, variance_explained);

            pcs.noalias() = emat * rotation;

            pca_utils::clean_up_projected<false>(pcs, variance_explained);

        } else {

            irb.run(emat, pcs, rotation, variance_explained);

            pca_utils::clean_up(pcs.rows(), pcs, variance_explained);

        }


        if (transpose) {

            pcs.adjointInPlace();

        }

    }


    template<typename Data_, typename Index_, typename Block_>

    void run_internal(

        const tatami::Matrix<Data_, Index_>* mat,

        const Block_* block,

        Eigen::MatrixXd& pcs,

        Eigen::MatrixXd& rotation,

        Eigen::VectorXd& variance_explained,

        Eigen::MatrixXd& center_m,

        Eigen::VectorXd& scale_v,

        double& total_var)

    const {

        irlba::EigenThreadScope t(nthreads);

        irlba::Irlba irb;

        irb.set_number(rank);

        irb.set_cap_number(true);


        if (block_weight_policy == WeightPolicy::NONE) {

            auto bdetails = pca_utils::compute_blocking_details(mat->ncol(), block);

            if (mat->sparse()) {

                run_sparse<false>(mat, block, bdetails, irb, pcs, rotation, variance_explained, center_m, scale_v, total_var);

            } else {

                run_dense<false>(mat, block, bdetails, irb, pcs, rotation, variance_explained, center_m, scale_v, total_var);

            }


        } else {

            auto bdetails = pca_utils::compute_blocking_details(mat->ncol(), block, block_weight_policy, variable_block_weight_parameters);

            if (mat->sparse()) {

                run_sparse<true>(mat, block, bdetails, irb, pcs, rotation, variance_explained, center_m, scale_v, total_var);

            } else {

                run_dense<true>(mat, block, bdetails, irb, pcs, rotation, variance_explained, center_m, scale_v, total_var);

            }

        }

    }


public:


    struct Results {

        Eigen::MatrixXd pcs;


        Eigen::VectorXd variance_explained;


        double total_variance = 0;


        Eigen::MatrixXd rotation;


        Eigen::MatrixXd center;


        Eigen::VectorXd scale;

    };


    template<typename Data_, typename Index_, typename Block_>


    Results run(const tatami::Matrix<Data_, Index_>* mat, const Block_* block) const {

        Results output;

        Eigen::MatrixXd rotation, center;

        Eigen::VectorXd scale;


        run_internal(mat, block, output.pcs, rotation, output.variance_explained, center, scale, output.total_variance);


        // Shifting them if we want to keep them.

        if (return_rotation) {

            output.rotation = std::move(rotation);

        }

        if (return_center) {

            output.center = center.adjoint();

        }

        if (return_scale) {

            output.scale = std::move(scale);

        }


        return output;

    }


    template<typename Data_, typename Index_, typename Block_, typename Subset_>


    Results run(const tatami::Matrix<Data_, Index_>* mat, const Block_* block, const Subset_* features) const {

        if (!features) {

            return run(mat, block);

        } else {

            auto subsetted = pca_utils::subset_matrix_by_features(mat, features);

            return run(subsetted.get(), block);

        }

    }


};


}


#endif

blocking.hpp
Utilities for handling blocks of cells.

scran::ResidualPca
Compute PCA after regressing out an uninteresting factor.
Definition ResidualPca.hpp:46

scran::ResidualPca::set_return_rotation
ResidualPca & set_return_rotation(bool r=Defaults::return_rotation)
Definition ResidualPca.hpp:151

scran::ResidualPca::run
Results run(const tatami::Matrix< Data_, Index_ > *mat, const Block_ *block) const
Definition ResidualPca.hpp:430

scran::ResidualPca::set_transpose
ResidualPca & set_transpose(bool t=Defaults::transpose)
Definition ResidualPca.hpp:141

scran::ResidualPca::set_variable_block_weight_parameters
ResidualPca & set_variable_block_weight_parameters(VariableBlockWeightParameters v=Defaults::variable_block_weight_parameters)
Definition ResidualPca.hpp:192

scran::ResidualPca::set_return_scale
ResidualPca & set_return_scale(bool r=Defaults::return_scale)
Definition ResidualPca.hpp:171

scran::ResidualPca::set_block_weight_policy
ResidualPca & set_block_weight_policy(WeightPolicy w=Defaults::block_weight_policy)
Definition ResidualPca.hpp:181

scran::ResidualPca::run
Results run(const tatami::Matrix< Data_, Index_ > *mat, const Block_ *block, const Subset_ *features) const
Definition ResidualPca.hpp:471

scran::ResidualPca::set_scale
ResidualPca & set_scale(bool s=Defaults::scale)
Definition ResidualPca.hpp:130

scran::ResidualPca::set_num_threads
ResidualPca & set_num_threads(int n=Defaults::num_threads)
Definition ResidualPca.hpp:201

scran::ResidualPca::set_rank
ResidualPca & set_rank(int r=Defaults::rank)
Definition ResidualPca.hpp:120

scran::ResidualPca::set_return_center
ResidualPca & set_return_center(bool r=Defaults::return_center)
Definition ResidualPca.hpp:161

scran
Functions for single-cell RNA-seq analyses.
Definition AggregateAcrossCells.hpp:18

scran::WeightPolicy
WeightPolicy
Definition blocking.hpp:82

scran::ResidualPca::Defaults
Default parameter settings.
Definition ResidualPca.hpp:51

scran::ResidualPca::Defaults::variable_block_weight_parameters
static constexpr VariableBlockWeightParameters variable_block_weight_parameters
Definition ResidualPca.hpp:80

scran::ResidualPca::Defaults::rank
static constexpr int rank
Definition ResidualPca.hpp:55

scran::ResidualPca::Defaults::return_rotation
static constexpr bool return_rotation
Definition ResidualPca.hpp:85

scran::ResidualPca::Defaults::transpose
static constexpr bool transpose
Definition ResidualPca.hpp:65

scran::ResidualPca::Defaults::return_scale
static constexpr bool return_scale
Definition ResidualPca.hpp:95

scran::ResidualPca::Defaults::scale
static constexpr bool scale
Definition ResidualPca.hpp:60

scran::ResidualPca::Defaults::block_weight_policy
static constexpr WeightPolicy block_weight_policy
Definition ResidualPca.hpp:75

scran::ResidualPca::Defaults::num_threads
static constexpr int num_threads
Definition ResidualPca.hpp:70

scran::ResidualPca::Defaults::return_center
static constexpr bool return_center
Definition ResidualPca.hpp:90

scran::ResidualPca::Results
Container for the PCA results.
Definition ResidualPca.hpp:370

scran::ResidualPca::Results::total_variance
double total_variance
Definition ResidualPca.hpp:389

scran::ResidualPca::Results::rotation
Eigen::MatrixXd rotation
Definition ResidualPca.hpp:397

scran::ResidualPca::Results::variance_explained
Eigen::VectorXd variance_explained
Definition ResidualPca.hpp:383

scran::ResidualPca::Results::pcs
Eigen::MatrixXd pcs
Definition ResidualPca.hpp:377

scran::ResidualPca::Results::center
Eigen::MatrixXd center
Definition ResidualPca.hpp:405

scran::ResidualPca::Results::scale
Eigen::VectorXd scale
Definition ResidualPca.hpp:412

scran::VariableBlockWeightParameters
Parameters for variable_block_weight().
Definition blocking.hpp:87