document categorization Latest Research Papers

A Comparative Study of Meta-Heuristic and Conventional Search in Optimization of Multi-Dimensional Feature Selection

International Journal of Applied Metaheuristic Computing ◽

10.4018/ijamc.292517 ◽

2022 ◽

Vol 13 (1) ◽

pp. 0-0

Keyword(s):

Feature Selection ◽

Support Vector ◽

Feature Selection Problem ◽

Adaptive Parameters ◽

Parameters Tuning ◽

Document Categorization ◽

Comparative Results ◽

Search Approach ◽

Performance Results ◽

Optimal Feature

Algorithmic – based search approach is ineffective at addressing the problem of multi-dimensional feature selection for document categorization. This study proposes the use of meta heuristic based search approach for optimal feature selection. Elephant optimization (EO) and Ant Colony optimization (ACO) algorithms coupled with Naïve Bayes (NB), Support Vector Machin (SVM), and J48 classifiers were used to highlight the optimization capability of meta-heuristic search for multi-dimensional feature selection problem in document categorization. In addition, the performance results for feature selection using the two meta-heuristic based approaches (EO and ACO) were compared with conventional Best First Search (BFS) and Greedy Stepwise (GS) algorithms on news document categorization. The comparative results showed that global optimal feature subsets were attained using adaptive parameters tuning in meta-heuristic based feature selection optimization scheme. In addition, the selected number of feature subsets were minimized dramatically for document classification.

A comparative evaluation of different keyword extraction techniques

International Journal of Information Retrieval Research ◽

10.4018/ijirr.289573 ◽

2022 ◽

Vol 12 (1) ◽

pp. 0-0

Keyword(s):

High Frequency ◽

Extraction Methods ◽

Text Summarization ◽

Keyword Extraction ◽

Extraction Techniques ◽

Scientific Texts ◽

Inverse Document Frequency ◽

Document Frequency ◽

Long Time ◽

Document Categorization

Retrieving keywords in a text is attracting researchers for a long time as it forms a base for many natural language applications like information retrieval, text summarization, document categorization etc. A text is a collection of words that represent the theme of the text naturally and to bring the naturalism under certain rules is itself a challenging task. In the present paper, the authors evaluate different spatial distribution based keyword extraction methods available in the literature on three standard scientific texts. The authors choose the first few high-frequency words for evaluation to reduce the complexity as all the methods are somehow based on frequency. The authors find that the methods are not providing good results particularly in the case of the first few retrieved words. Thus, the authors propose a new measure based on frequency, inverse document frequency, variance, and Tsallis entropy. Evaluation of different methods is done on the basis of precision, recall, and F-measure. Results show that the proposed method provides improved results.

Bangla Document Categorization Using Deep RNN Model with Attention Mechanism

10.1007/978-981-16-4284-5_13 ◽

2021 ◽

pp. 137-147

Author(s):

Mostaq Ahmed ◽

Partha Chakraborty ◽

Tanupriya Choudhury

Keyword(s):

Attention Mechanism ◽

Document Categorization

Word synonym relationships for text analysis: A graph-based approach

PLoS ONE ◽

10.1371/journal.pone.0255127 ◽

2021 ◽

Vol 16 (7) ◽

pp. e0255127

Author(s):

Hend Alrasheed

Keyword(s):

Text Mining ◽

Community Detection ◽

Text Analysis ◽

Structural Information ◽

Text Summarization ◽

Keyword Extraction ◽

Graph Analysis ◽

Extraction Techniques ◽

Timely Manner ◽

Document Categorization

Keyword extraction refers to the process of detecting the most relevant terms and expressions in a given text in a timely manner. In the information explosion era, keyword extraction has attracted increasing attention. The importance of keyword extraction in text summarization, text comparisons, and document categorization has led to an emphasis on graph-based keyword extraction techniques because they can capture more structural information compared to other classic text analysis methods. In this paper, we propose a simple unsupervised text mining approach that aims to extract a set of keywords from a given text and analyze its topic diversity using graph analysis tools. Initially, the text is represented as a directed graph using synonym relationships. Then, community detection and other measures are used to identify keywords in the text. The set of extracted keywords is used to assess topic diversity within the text and analyze its sentiment. The proposed approach relies on grouping semantically similar candidate words. This approach ensures that the set of extracted keywords is comprehensive. Differing from other graph-based keyword extraction approaches, the proposed method does not require user parameters during graph construction and word scoring. The proposed approach achieved significant results compared to other keyword extraction techniques.

Hierarchical Metadata-Aware Document Categorization under Weak Supervision

Proceedings of the 14th ACM International Conference on Web Search and Data Mining ◽

10.1145/3437963.3441730 ◽

2021 ◽

Author(s):

Yu Zhang ◽

Xiusi Chen ◽

Yu Meng ◽

Jiawei Han

Keyword(s):

Weak Supervision ◽

Document Categorization

Use of A Domain-Specific Ontology to Support Automated Document Categorization at the Concept Level: Method Development and Evaluation

Expert Systems with Applications ◽

10.1016/j.eswa.2021.114681 ◽

2021 ◽

pp. 114681

Author(s):

Yen-Hsien Lee ◽

Paul Jen-Hwa Hu ◽

Wan-Jung Tsao ◽

Liang Li

Keyword(s):

Method Development ◽

Domain Specific ◽

Document Categorization ◽

Level Method

Improved Document Categorization Through Feature-Rich Combinations

Proceedings of the International Conference on Artificial Intelligence and Computer Vision (AICV2021) - Advances in Intelligent Systems and Computing ◽

10.1007/978-3-030-76346-6_32 ◽

2021 ◽

pp. 346-355

Author(s):

Anoual El Kah ◽

Imad Zeroual

Keyword(s):

Document Categorization

Web Document Categorization Using Knowledge Graph and Semantic Textual Topic Detection

10.1007/978-3-030-86970-0_4 ◽

2021 ◽

pp. 40-51

Author(s):

Antonio M. Rinaldi ◽

Cristiano Russo ◽

Cristian Tommasino

Keyword(s):

Knowledge Graph ◽

Topic Detection ◽

Web Document ◽

Document Categorization

Text Document Categorization using Enhanced Sentence Vector Space Model and Bi-Gram Text Representation Model Based on Novel Fusion Techniques

10.7176/nmmc/93-03 ◽

2020 ◽

Keyword(s):

Vector Space ◽

Vector Space Model ◽

Text Representation ◽

Space Model ◽

Model Based ◽

Text Document ◽

Representation Model ◽

Document Categorization

Automated Document Categorization Model

Studies in Computational Intelligence - Machine Learning Algorithms for Industrial Applications ◽

10.1007/978-3-030-50641-4_2 ◽

2020 ◽

pp. 19-36

Author(s):

Rakhi Patra

Keyword(s):

Document Categorization ◽

Categorization Model

document categorization
Recently Published Documents

TOTAL DOCUMENTS

H-INDEX

A Comparative Study of Meta-Heuristic and Conventional Search in Optimization of Multi-Dimensional Feature Selection

A comparative evaluation of different keyword extraction techniques

Bangla Document Categorization Using Deep RNN Model with Attention Mechanism

Word synonym relationships for text analysis: A graph-based approach

Hierarchical Metadata-Aware Document Categorization under Weak Supervision

Use of A Domain-Specific Ontology to Support Automated Document Categorization at the Concept Level: Method Development and Evaluation

Improved Document Categorization Through Feature-Rich Combinations

Web Document Categorization Using Knowledge Graph and Semantic Textual Topic Detection

Text Document Categorization using Enhanced Sentence Vector Space Model and Bi-Gram Text Representation Model Based on Novel Fusion Techniques

Automated Document Categorization Model

Export Citation Format

document categorizationRecently Published Documents

TOTAL DOCUMENTS

H-INDEX

A Comparative Study of Meta-Heuristic and Conventional Search in Optimization of Multi-Dimensional Feature Selection

A comparative evaluation of different keyword extraction techniques

Bangla Document Categorization Using Deep RNN Model with Attention Mechanism

Word synonym relationships for text analysis: A graph-based approach

Hierarchical Metadata-Aware Document Categorization under Weak Supervision

Use of A Domain-Specific Ontology to Support Automated Document Categorization at the Concept Level: Method Development and Evaluation

Improved Document Categorization Through Feature-Rich Combinations

Web Document Categorization Using Knowledge Graph and Semantic Textual Topic Detection

Text Document Categorization using Enhanced Sentence Vector Space Model and Bi-Gram Text Representation Model Based on Novel Fusion Techniques

Automated Document Categorization Model

document categorization
Recently Published Documents