meta/doxygen/score__data_8h_source.html

 #ifndef META_SCORE_DATA_H_

 #define META_SCORE_DATA_H_


 #include "meta.h"


 namespace meta

 {


 namespace corpus

 {

 class document;

 }


 namespace index

 {

 class inverted_index;

 }

 }


 namespace meta

 {

 namespace index

 {


 struct score_data

 {

     // general info


     inverted_index& idx;

     double avg_dl;

     uint64_t num_docs;

     uint64_t total_terms;

     const corpus::document& query;


     // term-based info


     term_id t_id;

     uint64_t query_term_count;

     uint64_t doc_count;

     uint64_t corpus_term_count;


     // document-based info


     doc_id d_id;

     uint64_t doc_term_count;

     uint64_t doc_size;

     uint64_t doc_unique_terms;


     score_data(inverted_index& p_idx, double p_avg_dl, uint64_t p_num_docs,

                uint64_t p_total_terms, const corpus::document& p_query)

         : idx(p_idx), // gcc no non-const ref init from brace init list

           avg_dl{p_avg_dl},

           num_docs{p_num_docs},

           total_terms{p_total_terms},

           query(p_query) // gcc no non-const ref init from brace init list

     {

         /* nothing */

     }

 };

 }

 }


 #endif

meta::index::score_data::doc_unique_terms
uint64_t doc_unique_terms
number of unique terms in the doc
Definition: score_data.h:74

meta.h
Contains top-level namespace documentation for the META toolkit.

meta::index::inverted_index
The inverted_index class stores information on a corpus indexed by term_ids.
Definition: inverted_index.h:54

meta::index::score_data::num_docs
uint64_t num_docs
total number of documents
Definition: score_data.h:48

meta::index::score_data::doc_count
uint64_t doc_count
number of docs that t_id appears in
Definition: score_data.h:61

meta::index::score_data::corpus_term_count
uint64_t corpus_term_count
number of times t_id appears in corpus
Definition: score_data.h:63

meta::index::score_data::total_terms
uint64_t total_terms
total number of terms in the index
Definition: score_data.h:50

meta::index::score_data::score_data
score_data(inverted_index &p_idx, double p_avg_dl, uint64_t p_num_docs, uint64_t p_total_terms, const corpus::document &p_query)
Constructor to initialize most elements.
Definition: score_data.h:84

meta::corpus::document
Represents an indexable document.
Definition: document.h:31

meta::index::score_data::avg_dl
double avg_dl
average document length
Definition: score_data.h:46

meta
The ModErn Text Analysis toolkit is a suite of natural language processing, classification, information retreival, data mining, and other applications of text processing.
Definition: analyzer.h:24

meta::index::score_data::d_id
doc_id d_id
document id
Definition: score_data.h:68

meta::index::score_data::idx
inverted_index & idx
index queries are running on
Definition: score_data.h:44

meta::index::score_data::query_term_count
uint64_t query_term_count
query term count
Definition: score_data.h:59

meta::index::score_data
A score_data object contains information needed to evaluate a ranking function.
Definition: score_data.h:39

meta::index::score_data::query
const corpus::document & query
the current query
Definition: score_data.h:52

meta::index::score_data::doc_size
uint64_t doc_size
total number of terms in the doc
Definition: score_data.h:72

meta::index::score_data::doc_term_count
uint64_t doc_term_count
number of times the term appears in the current doc
Definition: score_data.h:70

meta::index::score_data::t_id
term_id t_id
doc term id
Definition: score_data.h:57